数据集

人工评估|技巧与提示

简单至上:标注任务避免不必要的复杂。将标注员的认知负担降低到最低有助于确保他们保持专注,从而提高标注质量。检查信息:标注任务避免引入不必要的信息。仅提供任务必需的信息即可,确保不对标注员产生额外偏见。内容简化:事物的展示位置和方式差异都可能导致额外的工作量和认

模型 数据集 元数据 2024-12-19 22:33  2

HumanEval 基准数据集

HumanEval是一个用于评估代码生成模型性能的重要基准数据集,最早由 OpenAI 在 Codex 论文中提出。它主要用于测试模型在编程任务中的代码生成能力,特别是通过自然语言描述生成功能正确的代码。

数据集 基准数据集 humaneval 2024-12-17 05:52  2

鲁棒目标检测数据集资源汇总

城市场景检测数据集,由五种不同的天气条件组成:白天 - 晴天、夜晚 - 晴天、黄昏 - 下雨、白天 - 有雾和夜间 - 下雨。这些图像是从不同的天气数据集中收集的:Cityscapes、BDD-100k、FoggyCityscapes 和 Adverse-We

数据集 鲁棒 鲁棒目标 2024-12-02 10:00  2

【AI系统】AI 发展驱动力

AI 起源于上世纪五十年代,经历了几次繁荣与低谷,直到 2016 年谷歌旗下的 DeepMind 发布 AlphaGo 程序赢得与世界围棋冠军的比赛,大众对 AI 的关注与热情被重新点燃。其实 AI 技术早在这个标志事件之前已经在工业界很多互联网公司中得到了广

数据集 神经网络模型 马冬梅 2024-11-29 23:38  2