返回列表 发帖

[文本处理] 可否有什么方法利用批处理替代word中的字符或数据吗

本帖最后由 delab-1 于 2024-9-30 14:49 编辑

各位大佬,有一个初级问题,有没有办法直接利用批处理程序,对word中的数据或者字符串进行修改或者替换的?或者退一步讲,有没有更为便捷的方法,借助小的便捷外部工具或者程序实现上述功能?

具体问题是有一个word文档,名称为export.docx。其内容大致如下:

2024年8月,中国粮食进出口AAAA百万美元,同比上升BBBB%。其中,出口CCCC百万美元,同比下降DDDD%;进口EEEE百万美元,同比上升FFFF%;当月净进口GGGG百万美元。

目前有一个上述变量对应的数值表,需要将对应代码替换成相应数值。利用批处理在文本处理中是很容易的,在word中是否有可行办法?看看大佬们有没有更好的处理方式。

回复 4# Batcher


    已经把问题重新明确了一下,感谢楼主

TOP

目前找到一个思路,先把word存成xml文件,然后用批处理进行处理替换,替换后再另存为docx格式,感觉格式未改变,效果还可以接受

TOP

回复 8# ppll2030 [/b

如果是这样,就不必用批处理,而是单独的其它程序操作呢?目前,这个操作用Jupiter可以很好实现,想探索批处理实现的可能。我目前采用:
1)将Word存为xml文件;
2)然后采用strrpc.exe命令进行替换文本
存在的问题是,替换过程比较慢,耗时较长;同时,不知为何,稳定性较差,不同版本的word,有些会出错,问题还在查找。

TOP

回复 10# idwma

运行不能成功,而且所建立的word文档也打不开了。操作过程如下:
1)建立export.docx文档,内容如下:
    2024年8月,中国粮食进出口AAAA百万美元,同比上升BBBB%。其中,出口CCCC百万美元,同比下降DDDD%;进口EEEE百万美元,同比上升FFFF%;当月净进口GGGG百万美元。
2)建立export.txt文档,内容如下:
AAAA=1
BBBB=2
CCCC=3

3)然后将提供的程序代码放在run.bat中,上述文件都在一个文件夹中。

双击运行,但是出现上述问题,运行不能成功,而且export.docx也打不开了

TOP

本帖最后由 delab-1 于 2024-10-2 16:15 编辑

回复 12# idwma


    运行成功啦,太棒了!能否简要介绍一下上述语言(如果有专门的学习材料就更好了),这样便于理解。例如,下面的语言对我就是全新的,有点类似python的语言用法,但是还是第一次遇到,如果有相关资料,学习一下就太好了

$a=new-object -com word.application
$a.visible=1
$b=$a.documents.open("$(dir export.docx)")

特别是,这些运行后面的参数是什么意思 execute($c[0],1,0,0,0,0,1,1,0,$c[1],2)

TOP

回复 10# idwma


    另外,做了一点扩展应用,数字替代效果都不错,有两个问题还请看看如何改建:
1)将替代的变量改为中文后,替代是成功的,但是打开的word文件显示的中文是很奇快的字符,如下:
例如,将下面左边的Name1,Name2,Name3替换成对应中文
Name1:张三
Name2:李四
Name3:王五

替换是成功的,但是打开word后,对应的中文是这样的,不知如何改进处理一下。
寮犱笁
鏉庡洓
鐜嬩簲

2) 按照您说的,把最后一行命令前的注释(#)去掉,但是运行结果显示有错误。
显示如下:
Argument:"1" should be a system.Managment.Automation. PSReference. USe [ref]
at line: 19 char:1
+$a.quit(-1,1,0)
+
       +category info : Notspecified [], MethodException
       +FullyQualifiedEorrorID:NonRefArgumentToRefParameterMsg

Press any key to continue....

因为对这个语言不熟悉,请帮助看看哪里出的问题。

感谢感谢

TOP

回复 15# ppll2030


    非常感谢,我对上述程序做了多次,但是中文替代后依然是乱码,数字是没有问题的。不知可否再改进一下?感觉再添加一个类似UTF-8显示的命令就可以了。
再次感谢帮助!

TOP

回复 15# ppll2030


我对上述程序做了多次,但是中文替代后依然是乱码,数字是没有问题的。不知可否再改进一下? 感觉再添加一个类似UTF-8显示的命令就可以了。
再次感谢帮助!

TOP

回复 20# ppll2030


太好了,这改进程序非常好地解决了中文显示乱码问题 。还有最后一个问题请教。因为需要替代代码较多,这个时候会出现下面这个问题:
例如有两个变量:
var_prov=100
var_prov_v1=123

在运行替换中,如果var_pro出现在前面,就会把文本中的“var_prov_10”替换为“100_v1”(即:把前面的“var_prov”直接替换了),针对这个问题,在程序上有什么好办法吗?

目前,我比较笨的解决办法是,让替代变量列表排序(向下排序),这样保障长变量在前面,即保障“var_prov_v1”在“var_prov”之前,这样也可以解决问题,但是很笨的方法。

再次感谢感谢!!!:loveliness: :loveliness:

TOP

回复 22# ppll2030


    太赞了,将批处理与上述程序组合在一起,效果还是蛮不错的 太感谢了

TOP

返回列表