【使用linux并发命令parallel加快处理文本文件】-原来是坑爹啊。

浏览:
字体:
发布时间:2013-12-13 14:31:30
来源:

1,看到oschina 上面的一篇文章

如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等

http://www.oschina.net/news/45477/use-cpu-cores-linux-commands

系统使用的是Redhat 5

parallel的官网:

http://www.gnu.org/software/parallel/

需要使用opensuse的源进行安装

http://software.opensuse.org/download.html?project=home%3Atange&package=parallel

 对于 CentOS CentOS-6,请以 根用户 root 运行下面命令:

cd /etc/yum.repos.d/wget http://download.opensuse.org/repositories/home:tange/CentOS_CentOS-6/home:tange.repoyum install parallel

对于 CentOS CentOS-5,请以 根用户 root 运行下面命令:

cd /etc/yum.repos.d/wget http://download.opensuse.org/repositories/home:tange/CentOS_CentOS-5/home:tange.repoyum install parallel

经测试wc -l 命令 发现在cpu数量是4的时候并没有提高计算时间,反而慢了。

计算1G文件行数,用wc-l花费 1s而使用 parallel后花费 10s

对于200MB的文件也是10倍的关系。

总结:

理论和实际使用还是有差别啊。在4cup的机器上面测试一点 优势也没有啊。

基本上要慢个 10倍以上啊。看来要处理大文件,还是hadoop比较靠谱啊。

>更多相关文章
24小时热门资讯
24小时回复排行
资讯 | QQ | 安全 | 编程 | 数据库 | 系统 | 网络 | 考试 | 站长 | 关于东联 | 安全雇佣 | 搞笑视频大全 | 微信学院 | 视频课程 |
关于我们 | 联系我们 | 广告服务 | 免责申明 | 作品发布 | 网站地图 | 官方微博 | 技术培训
Copyright © 2007 - 2024 Vm888.Com. All Rights Reserved
粤公网安备 44060402001498号 粤ICP备19097316号 请遵循相关法律法规
');})();