我们正在寻找能够为基于 LLM 的智能体设计切合实际且结构化的评估场景的人才。
你将创建测试用例,模拟人类执行的任务,并定义用于比较智能体操作的黄金标准行为。
你将努力确保每个场景定义清晰、评分准确,并且易于执行和重复使用。
你需要具备敏锐的分析思维、注重细节,并对 AI 智能体如何做出决策感兴趣。
尽管每个项目都是独一无二的,但您通常可能会:
根据实际任务设计结构化测试场景
定义黄金路径和可接受的代理行为
注释任务步骤、预期输出和边缘情况
与开发人员合作测试您的场景并提高清晰度
审查代理输出并相应地调整测试
如何开始
只需申请此职位,获得资格,即可有机会根据自己的时间安排,参与符合您技能的项目。从创建训练提示到优化模型响应,您将参与塑造 AI 的未来,同时确保技术惠及每个人。
要求
您拥有计算机科学、软件工程、数据科学/数据分析、人工智能/机器学习、计算语言学/自然语言处理 (NLP)、信息系统或其他相关领域的学士或硕士学位。
您拥有 3 年以上工作经验。您的英语水平达到高级 (C1) 或以上。
您准备好学习新方法,能够快速切换任务和主题,并能够应对具有挑战性的复杂指导。
我们的自由职业职位完全远程办公,因此您只需要一台笔记本电脑、网络连接、充足的时间和热情来迎接挑战。
为什么这个自由职业机会可能非常适合你?
凭借您的专业知识获得报酬,最高可达 55 美元/小时,具体取决于您的技能、经验和项目需求。
参与一个与您的主要职业或学术任务相符的兼职、远程、自由职业项目。
参与先进的 AI 项目,积累宝贵经验,提升您的作品集。
影响未来 AI 模型在您的专业领域理解和沟通的方式。