评估场景编写者 – AI 代理测试专家

欧洲 @Mindrift AI 写作训练平台发布于 3 周前

远程 View on Map
发布日期 : 2025年 9月 30日
过去七天累计 24 人申请

职位详情

职位 ID： 39695
工作经验三年
学历水平大专/本科

职位简介

我们正在寻找能够为基于 LLM 的智能体设计切合实际且结构化的评估场景的人才。
你将创建测试用例，模拟人类执行的任务，并定义用于比较智能体操作的黄金标准行为。
你将努力确保每个场景定义清晰、评分准确，并且易于执行和重复使用。
你需要具备敏锐的分析思维、注重细节，并对 AI 智能体如何做出决策感兴趣。
尽管每个项目都是独一无二的，但您通常可能会：
根据实际任务设计结构化测试场景
定义黄金路径和可接受的代理行为
注释任务步骤、预期输出和边缘情况
与开发人员合作测试您的场景并提高清晰度
审查代理输出并相应地调整测试

如何开始
只需申请此职位，获得资格，即可有机会根据自己的时间安排，参与符合您技能的项目。从创建训练提示到优化模型响应，您将参与塑造 AI 的未来，同时确保技术惠及每个人。

要求
您拥有计算机科学、软件工程、数据科学/数据分析、人工智能/机器学习、计算语言学/自然语言处理 (NLP)、信息系统或其他相关领域的学士或硕士学位。
您拥有 3 年以上工作经验。您的英语水平达到高级 (C1) 或以上。
您准备好学习新方法，能够快速切换任务和主题，并能够应对具有挑战性的复杂指导。
我们的自由职业职位完全远程办公，因此您只需要一台笔记本电脑、网络连接、充足的时间和热情来迎接挑战。

为什么这个自由职业机会可能非常适合你？
凭借您的专业知识获得报酬，最高可达 55 美元/小时，具体取决于您的技能、经验和项目需求。
参与一个与您的主要职业或学术任务相符的兼职、远程、自由职业项目。
参与先进的 AI 项目，积累宝贵经验，提升您的作品集。
影响未来 AI 模型在您的专业领域理解和沟通的方式。

商事登记公开

Name:
Toloka AI B.V.
Company Number
82041350
Status
Active
Company Type
Besloten Vennootschap
Jurisdiction
Netherlands

Restricted
This company has activated a Non Mailing Indicator (NMI) to indicate that they do not wish to receive unsolicited mail or sales visits. Their registered address should not be used for this purpose. See: https://www.kvk.nl/english/report-a-change/protecting-your-data-with-the-non-mailing-indicator/

专家推荐意见

这是一个完全在线工作的职位，因此无签证担保方面的问题，且办公成本低，雇主会有更大的意愿雇佣外国员工。

本职位将负责为 AI 智能体设计测试用例和场景，通过结果评估为智能体开发提供反馈及改进方向。因此求职者须对 AI 模型开发有较为深入的知识和实践经验。

分项评估

项目	评分（满分5星）
专业技能要求经验要求英文要求社会一般薪资水准对中国求职者接受度职场氛围评价	⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐ ⭐

将本文分享给您的朋友：

重要说明：跨境求职，简历写得漂亮远远不够，您还必须赢得雇主的信任。请立即阅读我们撰写的实操指南和服务介绍，了解如何以受信任的方式开始求职。

技能标签

人工智能工作经验测试编程质量远程工作

你可能感兴趣的职位

前端开发工程师
- @ High CP Southeast Asia
- 吉隆坡
东南亚