标题: [文本处理] 还是上次帮医务工作者求的代码,遇到点问题,求助朋友们再帮帮忙 [打印本页]
作者: seekbook 时间: 2022-1-9 13:10 标题: 帮医务工作者求助合并每行文本的批处理代码,感谢(已解决感谢大家)
本帖最后由 seekbook 于 2022-1-14 13:26 编辑
- @echo off
- setlocal enabledelayedexpansion
- cd /d "%~dp0"
- set "str="
- for /f "delims=" %%i in ('type "a.txt"') do (
- set "line=%%i"
- set str=!str!,!line!
- )
- >"a_New.txt" echo !str:~1!
复制代码
以上代码只能合并1000多条,后面就不能再合并了,这两天数据文本中的数量达到上万条时,就处理不了,麻烦大哥们帮忙改进一下,非常感谢,附件传不上来,附件a.txt的样例内容如下
链接:https://pan.baidu.com/s/1gtejPAwB02orYYo0uQRMSA?pwd=63sj
提取码:63sj
--来自百度网盘超级会员V5的分享
大概以后可能会处理有1万多行左右
作者: went 时间: 2022-1-9 13:20
空格变逗号复制代码
生成新文件复制代码
没有测试,应该正确
作者: Batcher 时间: 2022-1-9 13:24
回复 1# seekbook
test1.bat- @echo off
- setlocal enabledelayedexpansion
- cd /d "%~dp0"
- set "str="
- for /f "delims=" %%i in ('type "病例.txt"') do (
- set "line=%%i"
- set str=!str!,!line!
- )
- >"病例_New.txt" echo !str:~1!
复制代码
作者: Batcher 时间: 2022-1-9 13:26
回复 1# seekbook
test2.bat- @echo off
- cd /d "%~dp0"
- (for /f "delims=" %%i in ('type "病例.txt"') do (
- set /p =%%i,<nul
- ))>"病例_New.txt"
复制代码
作者: seekbook 时间: 2022-1-9 13:57
回复 2# went
谢谢,逗号可以了,生成新文件好像不行
作者: seekbook 时间: 2022-1-9 13:59
回复 3# Batcher
谢谢管理,刚才测试了这个会乱码
作者: went 时间: 2022-1-9 14:06
回复 5# seekbook
改成这样,还要把第10行的move语句删掉复制代码
作者: seekbook 时间: 2022-1-9 14:31
回复 7# went
感谢大哥,可以了,好像还忘了一个条件,就是病例里面有重复的行,有时有多好几条是一样的,只保留一条的话,这个可以麻烦帮我再加一下吗谢谢
作者: went 时间: 2022-1-9 15:07
回复 8# seekbook
保存为bat文件,选择ansi编码- powershell "(Get-Content '病例.txt' | Select-Object -Unique) -join ','" > "病例_NEW.txt"
复制代码
作者: Batcher 时间: 2022-1-9 16:47
回复 6# seekbook
请参考Q-04和Q-05把bat文件和txt文件都保存为ANSI编码:
https://mp.weixin.qq.com/s/6lbb97qUOs1sTyKJfN0ZEQ
作者: seekbook 时间: 2022-1-11 21:52 标题: 还是上次帮医务工作者求的代码,遇到点问题,求助朋友们再帮帮忙
本帖最后由 seekbook 于 2022-1-12 09:05 编辑
- @echo off
- setlocal enabledelayedexpansion
- cd /d "%~dp0"
- set "str="
- for /f "delims=" %%i in ('type "a.txt"') do (
- set "line=%%i"
- set str=!str!,!line!
- )
- >"a_New.txt" echo !str:~1!
复制代码
代码可以实现将文本每一行的内容加逗号变成一行,但是发现了一个问题,以上代码只能合并1000多条,后面就不能再合并了,这两天数据文本中的数量达到上万条时,就处理不了,麻烦大哥们帮忙改进一下,非常感谢,附件传不上来,附件a.txt的样例内容如下
链接:https://pan.baidu.com/s/1gtejPAwB02orYYo0uQRMSA?pwd=63sj
提取码:63sj
--来自百度网盘超级会员V5的分享
大概以后可能会处理有1万多行左右
作者: Batcher 时间: 2022-1-11 23:39
回复 11# seekbook
4楼代码是否有问题?
作者: Batcher 时间: 2022-1-11 23:40
回复 11# seekbook
如果需要上传文件,可以用阿里云盘或百度网盘。
作者: seekbook 时间: 2022-1-12 09:06
回复 12# Batcher
是的,还是有问题,我在原稿里把附件传上来了
作者: 5i365 时间: 2022-1-12 09:21
回复 9# went
大侠, 如果病例.txt文件的编码有多种情况, 后面生成的文件会有乱码, 怎样彻底解决? 我新开了一贴讨论
http://www.bathome.net/thread-61288-1-1.html
作者: seekbook 时间: 2022-1-14 13:27
(已解决感谢大家)
麻烦管理员将此贴标记一下谢谢
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |