大数据、机器学习与深度学习类命令行工具汇总

抓紧你的键盘!无需鼠标或者GUI,我们完全能够在OS X与Linux上完成大量操作。面向各类*N*X系统的大量出色命令行工具一直在技术行业拥有极高人气,且已经扩展至Python、Go、NodeJS乃至各类混合型工具当中。即使大家并不打算通过命令行运行整条数据处理管道,这些工具仍然能够带来可观助益。

公司主营业务:成都网站设计、成都网站制作、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。成都创新互联公司是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。成都创新互联公司推出巨鹿免费做网站回馈大家。

《命令行上的数据科学(Data Science at the Command Line)》一书与GitHub皆为我们带来大量高水平的预处理与后处理类工具选项,大家亦可根据需要对其进行针对性调整。在今天的文章中,我将向各位强烈推荐自己最为喜爱的那些相关工具。

CSVKit绝对值得一试。其能够利用逗号分隔值实现您所需要的一切。大家可以通过cvs cut剪切列、使用cvsgrip进行列过滤、通过sql2csv将PostgreSQL中的数据提取至CSV、使用cols从列中剪切子集并通过in2cv将微软Excel转换为CSV。

快速工具推荐清单

  • Python Data Analysis (Agate).

  • ImageMagick (edit, create, convert, flip, and alter images from the command-line).

  • JSON 2 CSV.

  • XML2JSON via NodeJS.

  • HTML to image.

  • HTML to PDF.

  • Weather Underground CLI.

  • NIFI Shell.

  • Gatling for Testing with Scala/JVM.

  • Kafka Producer with JSON.

  • Kafka Consumer with JSON.

  • Create JSON.

  • Image MetaData Extraction.

  • OSQuery for Querying Infrastructure.

  • Tesseract for Command Line OCR.

  • Hadoop/HDFS Command Line Tools.

  • CURL.

  • WGET.

  • MQTT CLI (NPM.JS).

大家亦可以编写简短的Python脚本以通过命令行实现数据处理。

 
 
  1. from nltk.sentiment.vader
  2. import SentimentIntensityAnalyzer
  3. import sys
  4. sid = SentimentIntensityAnalyzer()
  5. ss = sid.polarity_scores(sys.argv[1])
  6. print('Compound {0} Negative {1} Neutral {2} Positive {3} '.format(ss['compound'], ss['neg'], ss['neu'], ss['pos']))

只需要五行Python脚本即可实现情绪分析。

大家甚至可以通过命令行实现TensorFlow调试(不过其目前尚处于beta测试阶段,所以可能会出现一些问题)。

原文作者:Tim Spann

网页标题:大数据、机器学习与深度学习类命令行工具汇总
网页路径:http://www.hantingmc.com/qtweb/news44/77744.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联