Board logo

标题: [文本处理] 小复杂 随机提取TXT中几行组成新的句子输出 不知道BAT能否实现 [打印本页]

作者: chuan31    时间: 2011-6-7 11:06     标题: 小复杂 随机提取TXT中几行组成新的句子输出 不知道BAT能否实现

我有一个TXT文本 里面有10万个左右的短语 每行一个 短语长度不固定


一、按一个或多个关键词随机提取多个(具体数量可控制)这个TXT里面含有我指定的这一个或多个关键词的短

语组成一句话
-----比如我设定随机提取3-5个含有“作文”这个词的短语组成一句话,随机调用的短语之间用分隔符隔开,

分隔符可自己设置,总共生成100条 这个也是可设置的 最终实现的效果类似这样 作文代写-高考作文代写-专

业代写作文

二、由于那些短语字数不固定 所以我要求可以控制最终组成的这句话的数量
-----比如我设定此次限制为最低25个字,最高30个字,如果实际调用短语1+短语2+短语3的字数只要在25-30个

字之间都可以,否则就重新生成

三、由于数据比较大 十万行左右 随意性要求随机智能一些 不要老是在一个范围内提取

四、要求将按以上条件组合的结果导出为新的TXT格式
作者: chuan31    时间: 2011-6-7 11:18

顶起来啊 期待高手
作者: batman    时间: 2011-6-7 11:45

3-5个短语组成100个,重复的?




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2