Board logo

标题: [文本处理] [已解决]请问批处理如何提取网页部分内容? [打印本页]

作者: Bear_Cid    时间: 2024-5-11 10:51     标题: [已解决]请问批处理如何提取网页部分内容?

本帖最后由 Bear_Cid 于 2024-5-13 14:09 编辑

操作系统为Windows 10 企业版

因为需要对大量标准定期进行查新,故希望可以批量提取标准的最新版本名称,以便进行更新。
以ASTM D1512为例:
查询该标准的网址为:https://www.astm.org/catalogsearch/result/?q=D1512
如何将图中红框部分提取至txt或以其它文本方式保存?
[img][/img]

谢谢
作者: aloha20200628    时间: 2024-5-11 18:14

本帖最后由 aloha20200628 于 2024-5-13 11:26 编辑

回复 1# Bear_Cid

假设楼主已经用 https://www.astm.org/catalogsearch/result/?q=D1512 下载好对应的网页文件 D1512.html,用以下批处理代码(存为test.bat运行)即可将网页文件中的 D1512-23 截取到文件 D1512.txt
  1. @echo off
  2. for /f tokens^=2^delims^=^" %%a in (' findstr /ic:^"data-product-sku^=\^"D1512-^" "D1512.html" ') do set "v=%%a"
  3. echo,%v%>"D1512.txt"
  4. pause&exit/b
复制代码

作者: Bear_Cid    时间: 2024-5-13 08:30

回复 2# aloha20200628


    感谢回答,但按照上述流程操作后,txt文件中并无任何数据,目前同学使用其它工具解决了本主题的问题,但还是感谢提供回复以及帮助的您。
作者: aloha20200628    时间: 2024-5-13 10:24

本帖最后由 aloha20200628 于 2024-5-13 11:26 编辑

回复 3# Bear_Cid

抱歉复制代码时漏了一个^转义符,一字之差云泥之别
2楼代码已订正,测试成功...





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2