我最近开始使用Elixir,一些模式让我想起了在数据科学项目中广泛使用的Python。例如,列表理解或匿名函数。
考虑到Elixir的高性能以及运行多个进程和处理异步任务的能力,在我看来,它非常适合数据科学项目。
我是不是漏掉了一点?有人有这方面的经验吗?
发布于 2017-11-22 03:00:54
我提倡使用正确的工具来完成这项工作。进行数据科学通常有两个要求:
Python和R是正确的工具。它们提供了数量最多的高质量库,尽管它们本身速度很慢,但由于使用快速语言(如C和Fortran )编写和优化的库,它们的性能很好。
有些人喜欢像Julia和Scala这样的替代品。这些语言本身速度更快,并且有相当数量的库,尽管您可能仍然会遇到一些情况,即Python或R中有合适的库,但Julia或Scala中没有合适的库。
使用像Elixir这样的语言,你在很大程度上是靠自己的。数据科学特定库的数量是有限的,Elixir社区-尽管很棒-主要专注于分布式计算和web开发,所以不要指望那里有很多支持。
简而言之,你能吗?从技术上讲,是的,实验没有坏处,但你正在让你的生活变得更加困难。
还请记住,与流行的观点相反,当涉及到单线程性能时,Elixir并不是一种快速的语言。根据手头的任务,您会发现Ruby在某些情况下同样快,甚至更快。
不要误会我的意思,Elixir是一门伟大的语言,它最擅长的地方令人惊叹,只是它不是一种我第一次接触数学计算的语言。
发布于 2016-03-02 20:15:14
数据科学是一个非常广泛的话题,涉及到很多事情,我想补充我的2美分你肯定可以在灵丹妙药中做数据科学,但它可能不像其他一些工具那样做得很好,但你可以得到相当远的数据清洗和数据格式化的灵丹妙药。
还有其他人正在使用elixir/erlang https://moz.com/devblog/moz-analytics-db-free/做与数据相关的工作,还有一个disco允许您在erlang https://github.com/discoproject/disco中运行MapReduce作业
https://stackoverflow.com/questions/35725478
复制相似问题