perl处理文本,统计词组个数
时间:2011-05-24
来源:互联网
پېشقەدەم ئىنقىلابچىلارنى خەلق ئاممىسى چىن قەلبىدىن ھۆرمەتلەيدۇ .
بۇ گېنىرالنى جەڭچىلەر بەك ھۆرمەتلەيدۇ .
ئۇ ئۆز ئۇستازىغا ھۆرمەت نەزىرى بىلەن تىكىلىپ قارايتتى .
ئۇ ماركا يىغىشنى ياخشى كۆرىدۇ .
ماگىزىندا كىشىلەر ياقتۇرىدىغان كۈندىلىك بۇيۇملار سېتىلىۋاتىدۇ .
بىز ئارمىيە بىلەن خەلقنىڭ ئىتتىپاقلىقىنى كۆزىمىزنى ئاسرىغاندەك ئاسرىشىمىز لازىم .
بىز مەكتىپىمىزنىڭ دەل دەرەخ گۈل گىياھلىرىنى ئاسرىشىمىز لازىم .
تىرىشىپ ئۆگىنىدىغانلارنىڭ ھەممىسى ۋاقىتنى قەدىرلەشنى بىلىدۇ .
ھەممىمىز ئاشلىقنى قەدىرلەيلى .后面还有很多句子(几十万行都有可能),有可能一个句子一行,有可能一个句子由多行。这些维语句子被保存在word.txt文件中,且是Unicode格式。维语每个单词之间用空格隔开,现在我们将连续的两个单词组成一个词组,例如开头处:قەلبىدىن ھۆرمەتلەيدۇ 和 چىن قەلبىدىن依次进行下去;然后统计组成后的每个单词出现的次数,依次排列。
请问用perl怎么写程序?
بۇ گېنىرالنى جەڭچىلەر بەك ھۆرمەتلەيدۇ .
ئۇ ئۆز ئۇستازىغا ھۆرمەت نەزىرى بىلەن تىكىلىپ قارايتتى .
ئۇ ماركا يىغىشنى ياخشى كۆرىدۇ .
ماگىزىندا كىشىلەر ياقتۇرىدىغان كۈندىلىك بۇيۇملار سېتىلىۋاتىدۇ .
بىز ئارمىيە بىلەن خەلقنىڭ ئىتتىپاقلىقىنى كۆزىمىزنى ئاسرىغاندەك ئاسرىشىمىز لازىم .
بىز مەكتىپىمىزنىڭ دەل دەرەخ گۈل گىياھلىرىنى ئاسرىشىمىز لازىم .
تىرىشىپ ئۆگىنىدىغانلارنىڭ ھەممىسى ۋاقىتنى قەدىرلەشنى بىلىدۇ .
ھەممىمىز ئاشلىقنى قەدىرلەيلى .后面还有很多句子(几十万行都有可能),有可能一个句子一行,有可能一个句子由多行。这些维语句子被保存在word.txt文件中,且是Unicode格式。维语每个单词之间用空格隔开,现在我们将连续的两个单词组成一个词组,例如开头处:قەلبىدىن ھۆرمەتلەيدۇ 和 چىن قەلبىدىن依次进行下去;然后统计组成后的每个单词出现的次数,依次排列。
请问用perl怎么写程序?
作者: langlanglofa 发布时间: 2011-05-24
维吾尔语分词这么容易?没有单数的情况?
作者: iambic 发布时间: 2011-05-24
相关阅读 更多
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28