
Mercor(在拉丁语中意为“市场”,旨在建立全球最大的市场)是一家2023年成立于美国加利福尼亚州圣何塞的人工智能招聘初创公司。核心业务最初作为AI招聘平台,通过AI面试自动化匹配候选人与招聘公司;后转型为连接AI实验室(如OpenAI、Anthropic)与高技能专业人士(如来自高盛、麦肯锡的前员工)的数据标注与模型训练服务平台。估值与增长截至2025年末估值达100亿美元;收入增长迅猛,曾11个月内从100万美元增至1亿美元。

Mercor 是一家成立于2023年的美国人工智能初创公司,专注于连接高技能专业人才与AI大模型研发机构,提供高质量的人类反馈数据和专家标注服务,以训练和优化AI模型。核心信息概览。成立时间:2023年。总部地点:美国加利福尼亚州(注册于旧金山)。创始人:Brendan Foody(CEO),Adarsh Hiremath(CTO),Surya Midha(COO兼董事会主席)。三人均为00后,高中时期相识于辩论队,后共同辍学创业,并全部获得彼得·蒂尔(Peter Thiel)颁发的“蒂尔奖学金”。主营业务演变:1.初期:作为AI招聘平台,连接印度工程师与美国初创企业。2.转型:2023年后转向为AI实验室提供高技能专家的人类反馈数据,如医生、律师、金融分析师等参与AI模型训练与评估。

核心技术:开发了 APEX 评估体系,通过专业场景任务(如法律简报、财务备忘录)构建AI性能基准。平台日均支付薪酬超 150万–200万美元,管理超 3万名承包商。客户群体:包括 OpenAI、Google DeepMind、Meta、Anthropic 等头部AI公司。创始人财富状况(截至2026年3月)。三人各持公司约 22% 股份,每人身家约22亿美元(约合 170亿元人民币)。被《福布斯》和《胡润全球富豪榜》评为 “最年轻白手起家亿万富翁”,超越马克·扎克伯格创下的纪录。

融资与估值历程
时间 | 融资轮次 | 金额 | 投资方 | 估值 |
2023年 | 种子轮 | 360万美元 | General Catalyst 等 | — |
2024年 | A轮 | 3000万–3200万美元 | Benchmark、Peter Thiel、Jack Dorsey 等 | 2.5亿美元 |
2025年2月 | B轮 | 1亿美元 | Felicis Ventures 领投 | 20亿美元 |
2025年10月 | C轮 | 3.5亿美元 | Felicis Ventures 领投,Robinhood Ventures 等跟投 | 100亿美元 |
截至2026年初,Mercor 年度经常性收入(ARR)达 7.5亿美元。

近期动态与争议。安全事件(2026年4月):开源项目 LiteLLM(由 Mercor 支持)遭供应链攻击,恶意代码被植入。勒索组织 Lapsus$ 声称窃取内部数据(含 Slack 记录、AI对话视频等),Mercor 正委托第三方取证调查。劳工争议:2025年11月,Mercor 关闭 Meta 项目“Musen”,裁撤约 5000名标注员,并以 更低时薪(21→16美元)邀请其加入新项目“Nova”。被批评为“用灵活就业包装不稳定劳动”,暴露AI繁荣背后的人力成本问题。法律纠纷:2025年9月,竞争对手 Scale AI 起诉 Mercor 挖角高管并窃取商业机密,Mercor 否认指控。
Mercor作为一家2023年成立的AI招聘初创公司,在短短几年内估值突破百亿美元,其快速发展主要得益于以下几个关键因素:
1.精准把握AI训练数据市场机遇。Mercor成立时正值生成式AI爆发期,敏锐地抓住了AI实验室对高质量人类反馈数据的迫切需求。公司从AI招聘切入,迅速转型为专家级数据标注服务商,为OpenAI、Google、Meta等头部AI实验室提供RLHF(人类反馈强化学习)、SFT(监督微调)等后训练阶段所需的高技能专家。2.“博士军团”差异化定位。与Scale AI等竞争对手的规模化标注工场模式不同,Mercor专注于构建高技能专家网络,招募博士、律师、医生、国际象棋大师等垂直领域专家。这些专家时薪高达90-200美元,提供的专业标注质量远高于普通标注员,形成了独特的竞争壁垒。

3.技术驱动的全流程自动化平台。Mercor开发了AI驱动的端到端招聘平台,实现从简历解析、AI面试到人才匹配的全流程自动化。其AI面试系统能在20分钟内深度评估候选人,基于BERT的简历解析模型支持12种语言、37种格式,自动提取200+能力标签,匹配准确率达89%。4.强大的数据飞轮效应。平台形成了双边网络效应和数据增长飞轮:每新增一个企业客户带来2000多个标注样本,通过分析求职者表现数据优化评估模型,进而吸引更多客户,形成正向循环。这种数据积累-模型优化-客户增长的飞轮是Mercor的核心护城河。

5.创新的商业模式。Mercor采用按小时收费的“推荐费”模式:企业通过平台雇佣候选人后,按工作小时支付佣金。这种收入与服务使用量直接挂钩的模式降低了客户心理门槛,同时保证了收入的可持续性。6.卓越的创始团队与执行力。三位00后创始人(Brendan Foody、Adarsh Hiremath、Surya Midha)从哈佛和乔治城大学辍学创业,具有强烈的使命感和执行力。公司实行“996”工作文化(早9晚9,一周6天),创始人将其视为“选择对使命有深切关注的团队成员带来的副作用”。

7.资本市场的强力支持。Mercor获得了顶级风投的密集投资:2024年A轮融资3200万美元,2025年2月B轮融资1亿美元估值达20亿美元,同年10月C轮融资3.5亿美元估值飙升至100亿美元。投资方包括Felicis Ventures、Benchmark、General Catalyst以及Peter Thiel、Jack Dorsey等知名天使投资人。8.战略灵活性与转型能力。公司从最初的AI招聘平台成功转型为AI训练基础设施服务商,抓住了大模型从预训练向后训练转变的关键窗口期。这种快速适应市场变化的能力是其高速增长的重要保障。

面临的挑战与风险。尽管发展迅速,Mercor也面临一些挑战:估值泡沫风险(22倍营收倍数远高于行业平均)、对少数头部AI实验室客户的依赖、合成数据技术可能替代人类专家反馈的长期威胁,以及竞争对手Scale AI的法律诉讼等。总体而言,Mercor的成功是精准市场定位、技术创新、商业模式创新和卓越执行力共同作用的结果,在AI训练数据需求爆发的黄金时期,成功卡位了高质量人类专家服务这一关键环节。

Mercor的AI面试系统通过一套高度自动化的深度评估流程来评估候选人能力,其核心技术架构融合了先进的AI模型和多模态分析能力。AI面试评估流程。Mercor的AI面试是一个20分钟的结构化视频面试,整个过程无需人类面试官参与。具体流程包括:1.AI简历解析:系统深度扫描候选人的GitHub、简历、作品集等,构建360°人才画像。2.动态视频面试:AI面试官根据候选人背景和岗位需求,提出高度相关的问题,并进行智能追问、挑战假设,模拟真实技术对话。3.实时技能测试:对于技术岗位,AI会要求候选人进行屏幕共享编码或系统设计,并解释设计选择。4.结构化评估报告:基于预设的评估标准(rubric),系统生成详细评分报告,如“技术深度9.2/10,团队协作8.5/10”。

核心技术架构。1.语义搜索与人才画像构建。向量数据库与语义分析:将候选人背景信息转化为高维向量嵌入,计算与岗位需求的余弦相似度,实现精准匹配。多源数据整合:不仅分析简历,还整合GitHub代码库、专业作品集、社交媒体资料等,构建立体人才画像。2.多模态分析系统。语音/文本识别:实时处理候选人回答,分析语义理解、逻辑连贯性、创新思维等维度。动态评估能力:AI能根据回答内容自适应生成后续问题,深入考察技术深度和问题解决能力。

3.绩效预测模型(核心IP)。强化学习算法:基于超过10万份客户反馈的真实岗位绩效数据,通过RLHF训练“岗位胜任力预测模型”。高准确率:该模型在预测工作表现方面准确率超过92%,优于传统招聘平台3倍以上。数据飞轮效应:每成功匹配一次,候选人的实际工作表现数据都会反馈到系统中,持续优化模型。4.分层AI架构。通用基础模型:底层使用GPT-4等大型模型处理简历解析等通用任务。垂直领域模型:针对医疗、金融、法律等专业领域,接入行业知识库(如医疗UMLS、制造业ISO标准),具备行业拓展性。5.超越简历的信号网络。系统分析候选人动态的、非结构化的“文本信号网络”,如GitHub代码质量、技术博客深度、面试中的决策逻辑,评估“实际上能做什么”以及“思维方式是怎样的”。

评估维度与特点。核心评估维度。1.技术深度:系统设计能力、架构选择合理性、技术栈掌握程度。2.逻辑推理能力:问题分析、解决方案设计、决策逻辑。3.沟通清晰度:表达流畅性、思维结构化、避免使用填充词。4.垂直领域认知:专业知识的深度和广度,如医疗领域的复杂病例处理能力。5.创新思维:解决复杂问题的创造性方法。系统特点。标准化与去偏见:基于统一评估标准,减少人类面试官的主观偏见。资质复用机制:候选人通过某项评估后,成绩可无缝套用于其他兼容岗位。实时反馈:为候选人提供20+小时的AI模拟面试训练,实时反馈薄弱环节。全球化支持:支持150+国家地区的面试评估,打破地域限制。Mercor的AI面试系统通过将深度语义理解、多模态分析、强化学习预测模型相结合,实现了对候选人能力的全面、客观评估,其技术架构不仅关注“简历上写了什么”,更深入挖掘“候选人实际能做什么”以及“思维方式是怎样的”,形成了独特的技术护城河。

Mercor的AI面试系统在医疗、金融等专业领域有多个具体应用案例,通过与顶尖机构合作开发垂直领域的专属评估模型,实现了对专业人才的精准评估。医疗领域应用案例。1.手术机器人操作员评估(与梅奥诊所合作)。Mercor与梅奥诊所合作开发了专门用于评估手术机器人操作员的AI面试模型。该系统深度评估候选人在微创手术环境中的操作技能、空间感知能力和应急处理能力。评估重点:复杂病例处理经验:AI会询问候选人近期处理的复杂手术病例,评估其临床决策能力。技术操作精准度:通过模拟手术场景,评估手眼协调和精细操作技能。应急反应能力:模拟手术中突发状况,测试候选人的快速决策和问题解决能力。

2.全科医生(MD)评估体系。作为Mercor首创的AI生产力指数(APEX) 的一部分,医疗评估模块包含50个全科医生案例任务,每个案例由提示(任务描述)、来源(完成任务所需信息)和评分标准组成。评估维度:临床推理能力:基于症状描述进行鉴别诊断。治疗方案制定:根据患者具体情况制定个性化治疗计划。医疗伦理判断:处理复杂伦理困境的能力医学知识应用:将理论知识应用于实际临床场景。3.医疗AI训练专家评估。Mercor为AI实验室招募医疗专家来训练医疗大模型,时薪高达170美元。这些专家负责:评估AI的医疗相关答案质量。审查AI生成的医学研究。提供专业反馈用于RLHF训练。

金融领域应用案例。1.高频交易员压力测试(为高盛定制)。Mercor为高盛定制了高频交易员压力测试模块,专门评估交易员在极端市场条件下的表现。评估内容:市场波动应对:模拟闪崩、流动性枯竭等极端场景。风险控制能力:评估止损策略和仓位管理。决策速度与准确性:在毫秒级时间窗口内的交易决策质量。心理承受能力:持续压力下的情绪稳定性。2.金融研究专家评估(基础模型实验室案例)。Mercor为一家基础模型实验室创建了600个高质量的金融领域prompt-rubric对,用于评估LLM执行复杂金融研究任务的能力。项目具体配置:Trainers(写作者):85名至少大学学历的银行从业者/投资人/股票分析师。Reviewers(审阅者):20名具有更强领域专长的专家。任务类型:投资分析报告撰写、财务模型构建、风险评估等。质量要求:每个任务平均需要2轮审阅才能签收,确保专业准确性。

3.投资银行助理评估(APEX体系)。在APEX评估体系中,金融模块专门评估投资银行助理的核心能力:评估任务包括:财务建模与分析:构建DCF模型、LBO模型等。交易结构设计:并购、IPO、债券发行等交易方案。市场研究报告撰写:行业分析、公司估值报告。客户演示材料准备:投资建议书、路演材料。

专业领域评估的共同特点。1.高度定制化的评估标准。每个专业领域都有专门的评估准则(rubric),由领域专家设计,确保评估的专业性和准确性。例如医疗领域的评估标准由医生团队制定,金融领域的标准由投资银行家设计。2.动态交互式评估流程。AI面试官会根据候选人的回答进行智能追问和挑战假设,模拟真实的专业对话。对于医生候选人,会深入询问复杂病例的处理细节;对于金融分析师,会挑战其投资逻辑和风险评估。3.多维度能力评估。系统不仅评估技术知识,还评估:逻辑推理能力:分析复杂问题的思维过程。沟通清晰度:向非专业人士解释专业概念的能力。决策质量:在不确定条件下的判断能力。伦理合规意识:专业领域的道德和合规考量。4.真实场景模拟。通过案例分析和情景模拟,评估候选人在真实工作环境中的表现。例如让医生候选人处理急诊病例,让金融分析师在模拟市场波动中做出投资决策。

评估效果与价值。1.高质量人才筛选。Mercor的医疗专家时薪达170美元,金融专家时薪85-200美元,确保了评估者的专业水平。这种高成本投入换来了92%的岗位胜任力预测准确率,远高于传统招聘方式。2.标准化与去偏见。基于统一评估标准,减少了人类面试官的主观偏见,确保评估过程的一致性和公平性。特别是在医疗和金融这类高度专业化的领域,标准化评估尤为重要。3.效率大幅提升。传统招聘需要数月时间寻找特定领域专家,而Mercor能在几小时内完成从筛选到推荐的整个过程。例如为OpenAI寻找精通欧盟AI监管的律师,3小时内就推荐了3名合格候选人。4.数据驱动的持续优化。每次评估都会产生数据,用于持续训练和优化评估模型,形成数据飞轮效应:更多评估数据 → 更精准的模型 → 更高质量的匹配 → 更多客户使用。

行业影响与未来趋势。Mercor在专业领域的AI面试应用正在改变传统的人才评估方式:1.专业化程度不断提升。从通用的技术面试扩展到高度垂直的专业领域,如手术机器人操作、高频交易、法律合规等,评估维度越来越精细化。2.评估标准与行业标准对接。医疗评估对接临床实践指南,金融评估对接行业最佳实践,确保评估结果与实际工作需求高度匹配。3.从招聘到AI训练的双重价值。这些专业评估不仅用于人才招聘,还用于训练专业领域的大模型。医疗专家评估AI的医疗答案,金融专家评估AI的投资分析,形成了“人类训练AI,AI评估人类”的闭环。4.全球化专家网络构建。Mercor已管理超过3万名来自医疗、法律、金融、工程等领域的行业专家,构建了全球最大的专业人才评估网络。通过在这些专业领域的深度应用,Mercor不仅提高了招聘效率,更重要的是建立了专业人才评估的黄金标准,为AI时代的人才选拔和专业能力认证提供了新的范式。

Mercor的AI招聘平台在数据隐私和安全方面面临着严峻挑战,特别是在2026年4月初发生了重大数据泄露事件后,其安全实践的有效性受到质疑。Mercor平台处理的数据类型及敏感性。Mercor平台处理的数据包括:个人身份信息:求职者的姓名、联系方式、身份证件扫描件。专业数据:简历、工作经历、技能评估结果。生物特征数据:视频面试中的面部表情、声音和行为信号。企业敏感信息:客户内部项目代号、合作细节。平台核心资产:源代码、算法模型、匹配逻辑。这些数据中,生物特征数据(面部、声音)一旦泄露无法像密码一样重置,具有极高的隐私风险。

理论上应采取的隐私安全措施。根据行业标准,AI招聘平台应采取以下措施:1.技术防护措施。数据加密:对静态存储和传输中的敏感数据进行端到端加密。访问控制:基于角色的权限管理,最小权限原则。安全审计:完整的操作日志记录和异常行为监测。漏洞管理:定期安全扫描和渗透测试。2.合规与治理框架。数据分类分级:根据敏感程度实施差异化保护。隐私设计:在产品设计阶段嵌入隐私保护原则。第三方风险管理:对供应商和开源组件进行安全评估。应急响应计划:制定数据泄露应急预案。3.组织与流程保障。安全团队建设:配备专职数据安全官和团队。员工培训:定期进行安全意识教育。合规认证:获取ISO 27001、SOC 2等行业认证。

实际安全事件:2026年3月供应链攻击。事件概述:2026年3月底至4月初,Mercor遭受了严重的供应链攻击,导致约4TB核心数据被窃取并在暗网拍卖。攻击路径分析。初始入侵:黑客组织TeamPCP首先攻破了开源漏洞扫描工具Trivy的CI/CD流水线。供应链污染:在Trivy的76个版本标签中植入恶意代码。依赖传递:Mercor使用的开源AI代理层LiteLLM依赖了受污染的Trivy版本。最终渗透:恶意代码从Mercor系统中窃取凭证,攻击者利用这些凭证访问内部系统。泄露数据规模。939GB平台源代码。211GB用户数据库(包含求职者简历和个人信息)。约3TB存储桶内容(视频面试录像、承包商护照扫描件、证件照)。内部通信数据(Slack记录、工单系统数据)。AI系统与承包商对话视频。受影响范围。超过3万名承包商的身份验证资料可能暴露。疑似客户数据泄露:攻击者公开的样本中包含Amazon、Athena、Aphrodite、Meta、Apple等客户内部代号。生物特征数据永久风险:视频面试中的面部、声音数据无法重置。

事件暴露的安全漏洞。1.第三方依赖管理薄弱。Mercor严重依赖开源组件LiteLLM(每天下载数百万次),但未能有效管理供应链风险。攻击者通过污染上游依赖,成功渗透下游数千家企业。2.安全监控与响应不足。虽然恶意代码在几小时内被安全公司Snyk发现并清除,但攻击窗口期已造成实质性损害。Mercor在事件发生后确认自己是“数千家受影响企业之一”,表明其安全监控体系未能及时发现异常。3.数据保护措施不充分。泄露的数据包括大量未加密或弱加密的敏感信息,特别是生物特征数据缺乏特殊保护措施。4.应急响应透明度问题。Mercor发言人Heidi Hagberg拒绝回答事件是否与Lapsus$黑客组织的声明有关,也未明确客户或承包商数据是否被访问、外泄或滥用,缺乏透明度。

行业背景下的数据安全挑战。1. AI行业的“速度与安全”矛盾。AI行业快速发展往往以牺牲安全为代价。开源工具让AI发展如虎添翼,但也像互相连接的多米诺骨牌——推倒一块,后面一片全倒。2.开源组件依赖风险。根据IBM报告,每个AI项目平均依赖168个开源组件,其中暗藏66个已知漏洞,73%的项目存在高危漏洞。Mercor事件暴露了这种依赖的脆弱性。3.生物特征数据的特殊风险。视频面试数据包含不可重置的生物特征信息,一旦泄露将造成永久性隐私损害。已有律所宣布正在调查针对Mercor的集体诉讼。

对求职者和企业的启示。对求职者的建议。谨慎提供信息:在AI招聘平台避免提供非必要个人信息,特别是生物特征数据。使用替代身份:考虑使用昵称而非真实姓名注册。开启双重验证:为重要账号增加额外安全层。定期检查数据足迹:搜索自己的名字、手机号,监控异常信息泄露。对企业的警示。强化供应链安全:对开源组件进行严格安全审计。实施零信任架构:不信任任何内部或外部组件。加强生物特征数据保护:采用特殊加密和访问控制。建立应急响应机制:制定详细的数据泄露应对计划。

Mercor的案例表明,即使估值百亿美元的AI独角兽,在数据安全方面仍可能存在严重漏洞。其数据泄露事件源于供应链攻击,暴露了AI行业普遍存在的安全短板:过度依赖开源组件、安全投入滞后于业务发展、对生物特征数据保护不足。对于用户而言,在使用AI招聘平台时应保持警惕,避免过度分享敏感信息。对于行业而言,这一事件敲响了警钟:在追求AI效率的同时,必须将数据安全置于同等重要的位置,特别是在处理不可重置的生物特征数据时,需要采取比传统数据更严格的保护措施。目前Mercor正在第三方取证专家的支持下进行全面调查,但事件的具体影响范围和长期后果仍有待观察。这一事件可能会推动整个AI招聘行业加强数据安全标准和监管合规要求。



