评估场景编写者 – AI 代理测试专家

欧洲 @Mindrift AI 写作训练平台
科研学术 , 系统开发 , 软件/IT 技术
  • 远程 View on Map
  • 发布日期 : 2025年 8月 27日
  • 过去七天累计 0 人申请

职位详情

  • 职位 ID: 39695
  • 工作经验 三年
  • 学历水平 大专/本科
technology

职位简介

我们正在寻找能够为基于 LLM 的智能体设计切合实际且结构化的评估场景的人才。
你将创建测试用例,模拟人类执行的任务,并定义用于比较智能体操作的黄金标准行为。
你将努力确保每个场景定义清晰、评分准确,并且易于执行和重复使用。
你需要具备敏锐的分析思维、注重细节,并对 AI 智能体如何做出决策感兴趣。
尽管每个项目都是独一无二的,但您通常可能会:
根据实际任务设计结构化测试场景
定义黄金路径和可接受的代理行为
注释任务步骤、预期输出和边缘情况
与开发人员合作测试您的场景并提高清晰度
审查代理输出并相应地调整测试

如何开始
只需申请此职位,获得资格,即可有机会根据自己的时间安排,参与符合您技能的项目。从创建训练提示到优化模型响应,您将参与塑造 AI 的未来,同时确保技术惠及每个人。

要求
您拥有计算机科学、软件工程、数据科学/数据分析、人工智能/机器学习、计算语言学/自然语言处理 (NLP)、信息系统或其他相关领域的学士或硕士学位。
您拥有 3 年以上工作经验。您的英语水平达到高级 (C1) 或以上。
您准备好学习新方法,能够快速切换任务和主题,并能够应对具有挑战性的复杂指导。
我们的自由职业职位完全远程办公,因此您只需要一台笔记本电脑、网络连接、充足的时间和热情来迎接挑战。

为什么这个自由职业机会可能非常适合你?
凭借您的专业知识获得报酬,最高可达 55 美元/小时,具体取决于您的技能、经验和项目需求。
参与一个与您的主要职业或学术任务相符的兼职、远程、自由职业项目。
参与先进的 AI 项目,积累宝贵经验,提升您的作品集。
影响未来 AI 模型在您的专业领域理解和沟通的方式。

商事登记公开

Name:
Toloka AI B.V.
Company Number
82041350
Status
Active
Company Type
Besloten Vennootschap
Jurisdiction
Netherlands
Restricted
This company has activated a Non Mailing Indicator (NMI) to indicate that they do not wish to receive unsolicited mail or sales visits. Their registered address should not be used for this purpose. See: https://www.kvk.nl/english/report-a-change/protecting-your-data-with-the-non-mailing-indicator/

专家推荐意见

这是一个完全在线工作的职位,因此无签证担保方面的问题,且办公成本低,雇主会有更大的意愿雇佣外国员工。

本职位将负责为 AI 智能体设计测试用例和场景,通过结果评估为智能体开发提供反馈及改进方向。因此求职者须对 AI 模型开发有较为深入的知识和实践经验。

分项评估

项目 评分(满分5星)
专业技能要求
经验要求
英文要求
社会一般薪资水准
对中国求职者接受度
职场氛围评价
⭐ ⭐ ⭐
⭐ ⭐
⭐ ⭐ ⭐ ⭐
⭐ ⭐ ⭐
⭐ ⭐ ⭐
⭐ ⭐ ⭐ ⭐
将本文分享给您的朋友:
寻找与本职位相似但更适合您的最新岗位——升级为高级会员即可启动

技能标签

你可能感兴趣的职位