奥利弗是一位多才多艺的数据科学家和软件工程师,拥有十多年的经验和牛津大学的研究生数学学位. 从为初创公司构建机器学习解决方案,到领导项目团队,再到在高盛(Goldman Sachs)处理大量数据,我的职业任务都有. With this background, 他擅长快速掌握新技能,为最苛刻的企业提供强大的解决方案.
Eva是一名熟练的后端开发人员和机器学习工程师,具有可扩展性问题的经验, system administration, and more. 她有把事情安排得井井有条的天赋, readable, 可维护的应用程序和优秀的Python知识, Ruby, and Go. She is a quick learner and has worked in teams of all sizes.
Renee is a data scientist with over 12 years of experience, and five years as a full-stack software engineer. For over 12 years, 他曾在国际环境中工作, with English or German as a working language. 其中包括为德国和奥地利客户公司远程工作四年,以及作为德国电信国际分析团队成员远程工作九个月.
Aljosa是一名数据科学家和开发人员,在构建统计/预测机器学习模型方面拥有超过8年的经验, 分析噪声数据集, 设计和开发决策支持工具和服务. He joined Toptal because freelancing intrigues him, and the best projects and people are to be found here.
Dr. Karvetski作为一名数据和决策科学家有十年的经验. 他曾在学术界和工业界的各种团队和客户环境中工作, and has been recognized as an excellent communicator. 他喜欢与团队合作,构思和部署新颖的数据科学解决方案. 他精通R、SQL、MATLAB、SAS和其他数据科学平台.
Building a cross-platform app to be used worldwide
为游戏制作应用程序
引领数字化转型
挖掘实时数据将改变行业的游戏规则
Testimonials
没有Toptal就不会有Tripcents. Toptal Projects使我们能够与产品经理一起快速发展我们的基金会, lead developer, and senior designer. In just over 60 days we went from concept to Alpha. 其速度、知识、专业知识和灵活性是首屈一指的. Toptal团队是tripcents的一部分,就像tripcents的任何内部团队成员一样. 他们像其他人一样贡献并拥有开发的所有权. 我们将继续使用Toptal. 作为一家初创公司,它们是我们的秘密武器.
Brantley Pace, CEO & Co-Founder
Tripcents
I am more than pleased with our experience with Toptal. 和我一起工作的专业人员在几个小时内就和我通了电话. 在和他讨论了我的项目后,我知道他就是我想要的候选人. 我立即雇用了他,他没有浪费时间就完成了我的项目, 甚至通过添加一些很棒的设计元素来增加我们的整体外观.
Paul Fenley, Director
K Dunn & Associates
与我合作的开发者都非常出色——聪明、有动力、反应灵敏. 过去很难找到高质量的工程师和顾问. Now it isn't.
Ryan Rockefeller, CEO
Radeeus
Toptal understood our project needs immediately. 我们遇到了一位来自阿根廷的杰出自由职业者, from Day 1, 沉浸在我们的行业中, 与我们的团队无缝融合, understood our vision, 并产生了一流的结果. Toptal使与高级开发人员和程序员的联系变得非常容易.
我们使用Toptal聘请了一位具有丰富的Amazon Web Services经验的开发人员. 我们面试了四位候选人,其中一位非常符合我们的要求. 这个过程迅速而有效.
Abner Guzmán Rivera, CTO and Chief Scientist
Photo Kharma
Sergio was an awesome developer to work with. Top notch, responsive, and got the work done efficiently.
Dennis Baldwin, Chief Technologist and Co-Founder
PriceBlink
和Marcin一起工作是一种乐趣. He is competent, professional, flexible, 并且非常迅速地理解需要什么以及如何实现它.
André Fischer, CTO
POSTIFY
我们需要一位能立即开始我们项目的专业工程师. Simanas exceeded our expectations with his work. 不需要采访和追踪专家开发人员是一种非常节省时间的方法,并且让每个人都对我们选择切换平台以使用更健壮的语言感到更舒服. Toptal使这一过程变得简单方便. Toptal is now the first place we look for expert-level help.
我们与Toptal合作非常愉快. 他们为我们的应用程序找到了完美的开发人员,让整个过程变得非常简单. It was also easy to extend beyond the initial time frame, 我们可以在整个项目中保持同一个承包商. 我们强烈推荐Toptal,因为它可以快速无缝地找到高素质的人才.
Ryan Morrissey, CTO
应用商业技术有限责任公司
我对Toptal印象深刻. 我们的开发人员每天都和我交流,他是一个非常强大的程序员. He's a true professional and his work is just excellent. 5 stars for Toptal.
Pietro Casoar, CEO
Ronin Play Pty Ltd
Working with Toptal has been a great experience. Prior to using them, 我花了相当多的时间面试其他自由职业者,但没有找到我需要的. 在与Toptal合作后,他们在几天内就为我找到了合适的开发者. 与我一起工作的开发人员不仅提供高质量的代码, 但他也提出了一些我没有想到的建议. It's clear to me that Amaury knows what he is doing. Highly recommended!
George Cheng, CEO
Bulavard, Inc.
作为一名Toptal合格的前端开发人员,我还经营着自己的咨询业务. 当客户来找我帮忙填补他们团队中的关键角色时, Toptal is the only place I feel comfortable recommending. Toptal's entire candidate pool is the best of the best. Toptal是我在近5年的专业在线工作中发现的性价比最高的网站.
Ethan Brooks, CTO
Langlotz Patent & Trademark Works, Inc.
In Higgle's early days, 我们需要一流的开发者, at affordable rates, in a timely fashion. Toptal delivered!
Toptal makes finding qualified engineers a breeze. 我们需要一个有经验的ASP.. NET MVC架构来指导我们的启动应用程序的开发, Toptal在不到一周的时间里为我们找到了三位优秀的候选人. 在做出我们的选择后,工程师立即在线并开始工作. 这比我们自己发现和审查候选人要快得多,也容易得多.
雇用数据科学家的成本在不同的SMB和企业应用程序(例如, data collection, 数据仓库管理, predictive maintenance, fraud detection, and customer segmentation projects all have varying costs). In addition, data scientist salaries differ by region. 例如,在美国,Glassdoor报告称 average total pay for data scientists is $126,845 as of May 19, 2023.
如何聘请数据科学专家?
在招聘数据科学家时, 你首先要验证候选人在四个方面的能力:统计学, 商务及沟通技巧, programming, 以及生产数据集的经验. 接下来,您应该考虑特定于您的项目所需的熟练程度. Will a candidate need to work with complex or simple data? 他们需要机器学习经验吗? Finally, 将这些要求转化为详细的职位描述和有针对性的面试问题,以确定理想的数据科学家.
市场需要数据科学家吗?
Yes, data scientists are in extremely high demand. A data scientist shortage 在招聘顶尖专家时,就业市场上的竞争加剧了. 数据科学家的需求只会增加:未来十年,他们的就业增长率将达到惊人的水平 36%与平均5%的增长率相比,美国是最高的国家之一.
你应该如何为你的项目选择最好的数据科学家?
您可以通过全面评估候选人的技能以及他们与您的要求的匹配程度来确定最适合您的项目的数据科学家. 高质量的数据科学家通常拥有特定的基础技术技能:编程(如编程).g., Python, SQL), statistics, data wrangling, data visualization, machine learning, and cloud computing. 数据科学家还应该有偏见和风险评估的经验, 并且必须是能够理解业务需求的强大沟通者. 寻找具有使用这些硬技能和软技能来产生切实数据见解的记录的候选人.
你在Toptal能多快招到人?
一般来说,你可以在大约48小时内用Toptal雇佣一名数据科学家. 我们的人才匹配者是他们所匹配的领域的专家,他们不是招聘人员或人力资源代表. They’ll work with you to understand your goals, technical needs, 我们的团队充满活力,并从我们的全球人才网络中为您匹配理想的候选人.
一旦你选择了你的数据科学家, 你会有一个无风险的试用期,以确保他们是完美的匹配. Our matching process has a 98% trial-to-hire rate, 所以你可以放心,你每次都得到最合适的.
数据科学在现实生活中如何使用?
大多数现代公司,无论大小,每天都要处理大量的数据. Therefore, 数据科学可以应用于各种行业:它可以用于确保医疗保健中的准确诊断, select products for customers in digital marketing, perform risk assessments and fraud detection in finance, 并进行零售销售预测. 数据科学产生的洞察力使公司能够做出明智的决策, automate tasks, and boost innovation.
In 2012, Harvard Business Review 将数据科学家的角色定义为“21世纪最性感的工作,” and the demand for data scientists has only grown since then. 预计就业增长率为 36% 在接下来的十年里(与5%的平均增长率相比是最高的), data science has a long life ahead of it—and 91.9% 从2021年开始,超过一半的领先企业已经认识到这一事实,并加大了对大数据和人工智能的投资.
然而,数据科学并不是一个简单的领域,因为它需要许多熟练的技能. A data scientist shortage exists in the job market, 这导致了一场寻找能够仔细分析数据的经过审查的数据科学家的竞赛, 建立无偏算法, 并提出令人信服的见解.
At a minimum, 数据科学家需要广泛的统计和编程背景, and strong experience with production data sets and models. This guide specifies the job description tips, interview questions, 以及项目特定的技能要求,告知如何雇用数据科学家并最大限度地提高公司的数据洞察力.
A pragmatic, statistical, and data-driven mentality -处理数据需要统计学基础和对潜在缺陷和偏差的理解. Data scientists must comprehend potential technical risks, such as selection bias, survivorship bias, or Simpson’s paradox.
Good communication and business understanding -数据科学是高度跨学科的. 数据科学家应该能够将业务需求转化为实际的解决方案, 展示获得的见解, 用外行的话解释答案.
Experience with programming languages and databases – To handle, analyze, and present data, 数据科学家必须精通一门编程语言(通常是Python),并具有查询数据库(通常是SQL数据库)的经验, 不过根据你的项目,可能需要NoSQL数据库技能).
Experience with production data sets and models -高质量的候选人将具有生产数据集和模型的实际经验,而不是只使用测试数据集,如在Kaggle (i)上找到的数据集.e.、数据大赛经验). 数据竞赛并不能教会学生处理真实世界数据所需的所有技能.
Are you still wondering “What does a data scientist do?“没有简单的答案. 数据科学家是多才多艺的, 能够以多种方式从原始数据中创造价值的创造性思考者——他们必须掌握许多不同的概念.
Data wrangling – The ability to transform raw data into a usable form; data scientists use this skill to clean and organize data during the 提取、转换和加载 (ETL) process.
Data visualization – The visual presentation of data insights used to communicate key findings and verify results; data scientists should understand how to visualize and interpret data specific to your problem to ensure relevancy and avoid harm.
Machine learning – The ability to train models on past data to perform on unseen data; at a minimum, data scientists should know simple machine learning models.
Cloud computing – A key component of modern data-driven businesses; data scientists should be prepared to use cloud tools alongside models in cases requiring training, heavy computing power, 或者生产部署.
How can you identify the ideal Data Scientist for you?
在寻找符合您的项目需求的数据科学家时,需要考虑多个因素. When working with complex data or on more technical efforts, 包括研究和自动化, 你应该把重点放在有专长的候选人身上.
对于所有类型的项目, 以确保你有一个合适的, explain your problems, your business goals, and the data available, 然后让应聘者描述一下他们的相关经历.
Complex data—text, images, audio, video, and time-dependent data—should be treated carefully, 因为它的处理方式与表格数据非常不同,需要特殊的训练和方法. In this case, 候选人应该提供他们之前参与过的类似项目的详细概述,以及他们将如何将他们的技能应用到您的项目中.
如果您正在处理更简单的数据(例如.g.(结构化的、干净的数据),您可以用较少的技术来满足您的需求 data analyst. 你应该在什么时候招聘数据科学人才,而不是数据分析师? 这是一个长期争论的问题,没有一个普遍的答案. However, some differences are generally agreed upon:
Skill
Data Scientist
Data Analyst
Programming
Has strong programming experience (typically Python)
May not possess knowledge of programming languages
Working with data types
能处理原始的、非结构化的数据吗
Usually works with structured, clean data only
技术专门化
Builds processing pipelines and advanced models (e.g., prediction, classification, and automation)
创建针对非技术受众的报告、可视化和见解
Collaboration
主要与技术团队成员一起工作
主要与业务团队成员合作
如果您的项目包含高级技术目标—执行任务自动化, 解决开放式研究问题, or implementing global business improvements (e.g., 研究人工智能模型如何改善业务需求)——那么你的需求就会超越简单的数据分析, and you should focus on hiring data scientists.
当与数据科学家合作时, 您将从确定项目所需的数据科学保护伞下的精确专业化中受益:
Data mining specialists 从大型数据集中提取信息.
数据工程专家 格式化和结构化数据以供分析.
数据库管理专家 在公司范围内组织数据.
数据可视化专家 prepare interactive visual representations of data.
机器学习专家 create advanced models to solve complex problems.
Commonly, 不同专业领域的多名数据科学专家将共同努力实现团队目标.
如何为你的项目编写数据科学职位描述
当您确定了高质量数据科学家所需的技能和您的项目特定需求时, writing your job description is the next step. 你的职位描述应该包括:
The data at hand, problem statement, and project goals (e.g.、分析、可视化、预测模型创建、数据清理等.).
The technology stack and available resources, including the project’s software languages and frameworks, 需要云提供商, and database type.
数据科学家处理问题的灵活性, 他们可以使用哪些模型, and what the data processing pipeline might look like; good candidates will be able to suggest different approaches tailored to your problem.
You may reference a 数据科学家职位描述 template 作为一个起点,并根据您的需要进行调整,以确定最适合这项工作的数据科学家.
SQL是处理关系数据库时用于查询的标准语言. 它可以进行简单的查询(例如.g., 获取21岁以上的所有用户,以及汇总或计算统计值和其他计数的复杂查询. For example, a more complex query might identify all users older than 16, 按他们的工作分类, 并返回排序后的计数, average credit score, and average salary.
数据整理使数据集更容易分析和解释. 当起始数据没有很好地组织或缺乏标准结构时,这是必要的步骤. 它通常以标准方式格式化值,例如输入所有日期和时间 ISO 8601 format or organizing all phone numbers with prefixes. 数据争用还可以帮助数据验证:例如, 它可以处理一个人的年龄为734岁或负值的情况.
的好处是什么 数据科学中的云计算?
In short, cloud computing reduces machine learning costs. 机器学习模型在训练阶段通常是资源密集型的. 虽然他们可以使用任何机器.g., a laptop) for testing, once models are validated and ready for real training, they require much more computation time and power—and, in many cases, specific hardware, 哪个买起来特别贵. 云计算允许数据科学家租用硬件(并从云端执行计算)。, which makes training a model much more affordable.
我们已经涵盖了适用于许多项目的基本数据科学问题,这些问题作为起点,并展示了应聘者的答案中所期望的详细程度. However, 每个数据科学家都应该熟练掌握各种编程语言和统计概念. 您应该根据您的要求从以下指南中挑选额外的问题:
Data scientists serve many different roles depending on a company’s needs; for such a broad role, 没有一个适用于所有项目的面试问题列表.
为什么公司要雇佣数据科学家?
现代公司每天都要收集和处理大量的数据, 无论是从他们的内部过程, their customers, 或者其他外部资源. 经过治疗后 data is stored and often left unused. 如果你销售任何产品,你可能会有多年的订单历史记录. Past data yields future value—with the right data scientist.
“我什么时候应该雇佣一名数据科学家??” is “Almost always,特别是当你处理大型或复杂的数据集,并希望做出数据驱动的业务决策时. In smaller businesses, 数据科学家可以建立数据管道,并根据公司未来的努力提供收集数据的指导方针. For companies collecting larger amounts of data, 数据科学家可以提供见解, 建议数据驱动的决策, 训练预测模型.
由于数据是高度特定于公司的,业务关注点可能会有很大差异, 很难对数据科学家的工作做出概括. However, we can examine a few example scenarios: