求助!比较特殊的去除重复行
时间:2011-05-04
来源:互联网
http://www.sina.com.cn
http://www.sina.com.cn
http://www.sina.com.cn
http://www.sina.com.cn
http://www.sina.com.cn
################
http://www.163.com.cn
http://www.163.com.cn
http://www.163.com.cn
http://www.163.com.cn
http://www.163.com.cn
################
http://www.163.com
http://www.163.com
http://www.163.com
http://www.163.com
http://www.163.com
################
我想得到的结果是
http://www.sina.com.cn
################
http:/www.163.com.cn
################
http://www.163.com
################
用sort -u 得到的结果 不太一样
这个怎么处理??
作者: vitas333_cu 发布时间: 2011-05-04
################
之间的每一行内容都一样?
作者: cjaizss 发布时间: 2011-05-04
回复 vitas333_cu
- awk '!/^#*$/&&++a[$1]==1{print }/^#*$/{delete a;print}' file
- http://www.sina.com.cn
- ################
- http://www.163.com.cn
- ################
- http://www.163.com
- ################
作者: yinyuemi 发布时间: 2011-05-04
- awk '/^http/&&!a[$0]++{print $0"\n\n################\n"}' urfile
作者: ly5066113 发布时间: 2011-05-04
- for line in `grep http: urfile | sort -u`
- do
- echo $line
- echo
- echo "################"
- echo
- done
作者: Shell_HAT 发布时间: 2011-05-04
如下:
http://www.sina.com.cn
http://www.sina.com.cn
http://www.sina.com.cn
http://www.sina.com.cn
http://www.sina.com.cn
----------------------
http://www.163.com.cn
http://www.163.com.cn
http://www.163.com.cn
http://www.163.com.cn
http://www.163.com.cn
----------------------
http://www.163.com
http://www.163.com
http://www.163.com
http://www.163.com
http://www.163.com
----------------------
得到的结果是
http://www.sina.com.cn
----------------------
http:/www.163.com.cn
----------------------
http://www.163.com
----------------------
作者: vitas333_cu 发布时间: 2011-05-04
不行
作者: vitas333_cu 发布时间: 2011-05-04
作者: cjaizss 发布时间: 2011-05-04
回复 vitas333_cu
思路一样的啊,
awk '!/^-*$/&&++a[$1]==1{print }/^-*$/{delete a;print}' file
or:
awk '/http/&&++a[$1]==1{print }!/^http/{delete a;print}' file
作者: yinyuemi 发布时间: 2011-05-04
老哥, 确实不一样啊。
会把 #### 去掉 重复的。 只有1个了。
而且 url地址会单独写在开头每行中。
作者: vitas333_cu 发布时间: 2011-05-04
老哥, 确实不一样啊。
会把 #### 去掉 重复的。 只有1个了。
而且 url ...
vitas333_cu 发表于 2011-05-04 13:16
我说的是uniq,又不是sort -u
作者: cjaizss 发布时间: 2011-05-04
- echo 'http://www.sina.com.cn
- http://www.sina.com.cn
- http://www.sina.com.cn
- http://www.sina.com.cn
- http://www.sina.com.cn
- ################
- http://www.163.com.cn
- http://www.163.com.cn
- http://www.163.com.cn
- http://www.163.com.cn
- http://www.163.com.cn
- ################
- http://www.163.com
- http://www.163.com
- http://www.163.com
- http://www.163.com
- http://www.163.com
- ################' |uniq
- http://www.sina.com.cn
- ################
- http://www.163.com.cn
- ################
- http://www.163.com
- ################
作者: cjaizss 发布时间: 2011-05-04
- cat file.txt|sed '/^$/d'|uniq
- cat file.txt|awk '!/^$/{a=$1;if(a==b){next}else{print};b=$1}'
作者: yhywl 发布时间: 2011-05-04
不行啊, 测试后 ,原文输出了
作者: vitas333_cu 发布时间: 2011-05-04
dos2unix your file
作者: yinyuemi 发布时间: 2011-05-04
就是在 linux下 操作的。 我还是把源文件 拿出来吧
作者: vitas333_cu 发布时间: 2011-05-04
作者: ywlscpl 发布时间: 2011-05-04
热门阅读
-
office 2019专业增强版最新2021版激活秘钥/序列号/激活码推荐 附激活工具
阅读:74
-
如何安装mysql8.0
阅读:31
-
Word快速设置标题样式步骤详解
阅读:28
-
20+道必知必会的Vue面试题(附答案解析)
阅读:37
-
HTML如何制作表单
阅读:22
-
百词斩可以改天数吗?当然可以,4个步骤轻松修改天数!
阅读:31
-
ET文件格式和XLS格式文件之间如何转化?
阅读:24
-
react和vue的区别及优缺点是什么
阅读:121
-
支付宝人脸识别如何关闭?
阅读:21
-
腾讯微云怎么修改照片或视频备份路径?
阅读:28