Spark

Spark开发人员职位描述模板

Apache Spark已经成为分布式数据处理最常用的框架之一. 其成熟的代码库, 水平可伸缩性, 弹性使它成为处理大量数据的好工具.

Share

Apache Spark已经成为分布式数据处理最常用的框架之一. 其成熟的代码库, 水平可伸缩性, 弹性使它成为处理大量数据的好工具.

Spark强大的功能和灵活性要求开发人员不仅要了解Spark API:他们还必须了解分布式存储的陷阱, 如何构建一个能够处理5V大数据量的数据处理管道, 速度, 各种, 真实性, 以及价值——以及如何将其转化为可维护的代码.

Spark开发人员-职位描述和广告模板

复制此模板,并将其修改为自己的模板:

公司介绍

{{写一段简短而醒目的关于你公司的文字. 一定要提供有关公司文化、津贴和福利的信息. 提及办公时间, 远程工作的可能性, 以及所有你认为能让你的公司有趣的东西. }}

工作描述

我们正在寻找一个Spark开发人员谁知道如何充分利用我们的Spark集群的潜力.

你会打扫, 变换, 并使用Spark分析来自不同系统的大量原始数据,为我们的功能开发人员和业务分析师提供现成的数据.

这既涉及临时请求,也涉及嵌入到生产环境中的数据管道.

责任

  • 创建用于数据转换和聚合的Scala/Spark作业
  • 为Spark转换和助手方法生成单元测试
  • 用所有代码编写scaladoc风格的文档
  • 设计数据处理管道

技能

  • Scala(重点关注函数式编程范式)
  • Scalatest, JUnit, Mockito {{,嵌入式Cassandra}}
  • Apache Spark 2.x
  • {{Apache Spark RDD API}}
  • {{Apache Spark SQL DataFrame API}}
  • {{Apache Spark MLlib API}}
  • {{Apache Spark GraphX API}}
  • {{Apache Spark Streaming API}}
  • Spark查询调优和性能优化
  • SQL数据库集成 {{Microsoft, 甲骨文, Postgres和/或MySQL}}
  • 工作经验 {{HDFS、S3、Cassandra和/或DynamoDB}}
  • 对分布式系统的深刻理解.g. CAP定理、分区、复制、一致性和一致性)
参见:Toptal不断增长的社区驱动列表 Spark面试必备问题

Toptal Engineers最近的Spark文章

找到合适的Spark面试问题

阅读社区驱动的Spark面试问题列表.
阅读它们,评论它们,甚至贡献你自己的.

阅读问题

现在就雇佣一名顶尖的Spark开发者

Toptal是一个面向顶尖Spark开发者的市场, 工程师, 程序员, 程序员, 架构师, 和顾问. 顶级公司和初创公司选择Toptal Spark自由职业者来完成他们的关键任务软件项目.

查看他们的个人资料

史蒂夫·福克斯

自由Spark开发人员

美国Toptal成员 Since 2019年8月21日

Steve是一名经过认证的AWS解决方案架构师,拥有大数据和机器学习专业认证. 他有不同的背景, 体验建筑设计, 建筑, 以及在AWS上运行大数据机器学习应用程序. Steve担任过从技术贡献者到CTO和CEO的职务.

显示更多

Andreas Bollig

自由Spark开发人员

德国Toptal成员 Since 2019年11月22日

有Ph值.D. 在电气工程方面有丰富的机器学习应用开发经验, 安德烈亚斯横跨整个人工智能价值链, 从用例识别和可行性分析到定制统计模型和应用程序的实现. 在整个项目, 他一直专注于解决手头的业务问题,并从数据中创造价值.

显示更多

路易吉Crispo

自由Spark开发人员

阿拉伯联合酋长国Toptal成员 Since 2019年12月6日

Luigi是一位经验丰富的云和领导力专家,在各种环境中拥有超过二十年的专业经验. 他对技术和价值驱动的项目充满热情,并且具有很强的适应能力. Luigi已经直接参与了一些推动数字时代的领导者的重大行业转型浪潮.

显示更多

金成俊(安德鲁)

自由Spark开发人员

澳大利亚Toptal成员 Since 2020年6月18日

作为一名拥有20多年经验的高效技术领导者, Andrew专门研究数据:集成, 转换, 工程, 分析, 可视化, 科学, ETL, 大数据架构, 分析平台, 云架构. 他拥有构建数据平台的一系列技能, 分析咨询, 趋势监测, 数据建模, 数据治理, 还有机器学习.

显示更多

渝保

自由Spark开发人员

美国Toptal成员 Since 2019年8月28日

在过去的三年里,我一直在学习先进的机器学习(ML)理论, 可以肯定地说,Yuxiang对机器学习非常了解,他使用尖端的机器学习算法和工具交付了多个项目. 在学校期间,他还花了两年时间研究NLP. 在ML和NLP方面有扎实的知识基础, 实践经验, 以及优秀的书面和口头沟通技巧,宇翔将为你的项目增加价值.

显示更多

伊万尼克拉艾

自由Spark开发人员

捷克共和国Toptal成员 Since 2019年11月21日

Ivan拥有在网络安全和金融行业担任数据科学家和数据工程师的经验. 这包括处理和清理数据, 通过设计功能和应用机器学习技术来解决问题,形式化业务问题并创建解决方案. 他使用Spark和MapReduce处理大数据, 并且可以以易于理解的格式将结果可视化并呈现给涉众.

显示更多

迭戈·阿里尔·本德斯基

自由Spark开发人员

阿根廷Toptal成员 Since 2019年10月14日

Diego拥有超过15年的计算机科学从业经验. 他为各种规模的公司工作过, 现场和远程, 主要担任高级开发人员/架构师(C/ c++编程), Python和最近的Go), 作为小程序员团队的技术领导. 他有解决问题的态度,喜欢为每一项任务使用最合适的工具. 他是两项专利和一些研究出版物的合著者.

显示更多

Weidong叮

自由Spark开发人员

加拿大Toptal成员 Since 2020年6月24日

作为一名资深数据/集成架构师,丁伟东有着丰富的经验, 最近专注于SAP数据服务. 他的详细, 亲自动手的, 高效,后台规划全面, 设计, 并为银行业的主要机构实施信息系统, 运输, 零售, 以及政府部门. 他有很强的沟通能力和客户服务能力, 与客户和同事合作取得成功.

显示更多

现在注册以查看更多资料.

开始招聘

Toptal连接 排名前3% 世界各地的自由职业人才.

加入Toptal社区.