Board logo

标题: [问题求助] PowerShell怎样统计文本中每个单词出现次数? [打印本页]

作者: DAIC    时间: 2013-7-10 11:00     标题: PowerShell怎样统计文本中每个单词出现次数?

文本a.txt内容如下:
bat vbs powershell bat
vbs powershell vbs

每个单词在一行中出现多次的,只统计一次。
例如,bat在第一行中出现了两次,但我们只算一次。希望得到的结果:
bat 1
vbs 2
powershell 2
作者: PowerShell    时间: 2013-7-10 14:43

本帖最后由 PowerShell 于 2013-7-10 15:14 编辑

每个单词在一行中出现多次的,只统计一次。-----你这个不是一般的统计了.

我觉的powershell,或者python语言,解题逻辑差不多,如下:
1 开文本,取1行----这个不多说了.
2 把多个tab 替换成1个空格,把多个空格替换成1个空格.
3 切割,空格,形成一个数组,
4 把数组中的数,逐个加入哈希表.达到行去重.
5 把哈希表中的元素,逐个,添加入另一个哈希表.另一个哈希表如:
bat 1
vbs 2
powershell 2
你看看手册,试着写写,看能写出来不?
5 把哈希表中的元素,逐个,添加入另一个数组,然后group-object 此数组也行.
作者: DAIC    时间: 2013-7-10 21:06

回复 2# PowerShell


    太复杂了,玩不转。能否给个代码学习一下?
作者: PowerShell    时间: 2013-7-12 10:21

$a="bat vbs powershell bat
vbs powershell vbs"
$a.split("`n")|%{$_.split("",[StringSplitOptions]::RemoveEmptyEntries)|group}|%{$_.name}|group

不是我写的,我测试了,行。




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2