python 菜鸟求救
时间:2011-09-23
来源:互联网
我想从文章里读的中文变成1个字1行的文件。比如有这样的文章。"决赛的<hc>斯托瑟</hc>"
处理以后是:
决
赛
的
斯 B-I
托 B-O
瑟 B-O
现在不知道<hc>的部分怎么处理,处理完了以后不要<hc>,</hc>.这个问题要用正则吗?
代码如下:
#!/usr/bin/env python
#coding=utf-8
f = open('1.txt','r')
lines=f.readlines()
f.close()
f = open('out.txt', 'w')
for line in lines:
u1 = unicode(line.rstrip().strip(),'gb2312')
length=len(u1)
for i in range(length):
f.write(u1[i].encode("utf8"))
f.write("\n")
f.close()
处理以后是:
决
赛
的
斯 B-I
托 B-O
瑟 B-O
现在不知道<hc>的部分怎么处理,处理完了以后不要<hc>,</hc>.这个问题要用正则吗?
代码如下:
#!/usr/bin/env python
#coding=utf-8
f = open('1.txt','r')
lines=f.readlines()
f.close()
f = open('out.txt', 'w')
for line in lines:
u1 = unicode(line.rstrip().strip(),'gb2312')
length=len(u1)
for i in range(length):
f.write(u1[i].encode("utf8"))
f.write("\n")
f.close()
作者: taijun918 发布时间: 2011-09-23
没看懂B-I和B-O都是什么东东?
作者: iambic 发布时间: 2011-09-23
在这里<hc>..</hc>是代表人名,B-I是人名的开始,B-O剩余的人名。
作者: taijun918 发布时间: 2011-09-23
相关阅读 更多
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28