标题: [文本处理] [已解决]批处理实现特殊内容文本的转换 [打印本页]
作者: hlzj88 时间: 2017-9-2 23:05 标题: [已解决]批处理实现特殊内容文本的转换
经过努力,终于从头条网得到了头条网头条号的网页内标题链接文件,收集了二百多,但他的内容编码着实是看不懂,没有汉字,经百度,可以根据阿里西西网的这个网页将文本替换看到汉字,但如此替换和手动处理,不能令人满意。
文本部分内容是这样的:"title": "\u5143\u7d20\u5468\u671f\u8868\u79d2\u6740", "has_video": true, "chinese_tag": "\u89c6\u9891", "source": "\u5c0f\u4ed9\u8bb2\u5b66", "group_source": 2, "comments_count": 0, "media_url": "/m1570157394148353/",其中\u5143就是某个汉字,个人能力浅薄,没有更好的办法处理。因此发帖希望能有方法可以依据文本内容批量得到将这些转换为汉字的文本。
请高人出手帮助。
作者: happy886rr 时间: 2017-9-2 23:56
回复 1# hlzj88 - <a href="http://www.toutiao.com//item/6438797786048627202/" target="_blank">[1].元素周期表秒杀</a><br>
- <a href="http://www.toutiao.com//item/6449600872820245005/" target="_blank">[2].这没见过的物理公式解题简直逆天,老师那都学不到</a><br>
- <a href="http://www.toutiao.com//item/6438857389583106562/" target="_blank">[3].高中物理相对滑动和相对位移怎么破,你们都out了</a><br>
- <a href="http://www.toutiao.com//item/6447444671302992397/" target="_blank">[4].这样子想物理大题,还真快极啦</a><br>
- <a href="http://www.toutiao.com//item/6438799751117799938/" target="_blank">[5].化学选修3 零散知识点</a><br>
- <a href="http://www.toutiao.com//item/6441759030116352526/" target="_blank">[6].还在为三角恒等变换烦恼吗?新思路上市啦</a><br>
- <a href="http://www.toutiao.com//item/6438739004287353345/" target="_blank">[7].化学选修3 晶胞</a><br>
- <a href="http://www.toutiao.com//item/6443519108012048909/" target="_blank">[8].化学图像终于出秒杀视频啦</a><br>
- <a href="http://www.toutiao.com//item/6435038830813774337/" target="_blank">[9].怎么快速寻找等电子体?</a><br>
- <a href="http://www.toutiao.com//item/6438798536682242562/" target="_blank">[10].轻松理解电子式的书写</a><br>
- <a href="http://www.toutiao.com//item/6438840409480233473/" target="_blank">[11].轻松理解杂化方式和空间构型</a><br>
- <a href="http://www.toutiao.com//item/6438802762225418754/" target="_blank">[12].秒杀 离子方程式</a><br>
复制代码
作者: 老刘1号 时间: 2017-9-3 07:55
http://www.bathome.net/thread-44850-1-1.html
作者: hlzj88 时间: 2017-9-3 10:46
回复 3# 老刘1号
谢谢你,论坛的能量是满满的。
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |