首页

[切换至繁体版]

返回

关灯 护眼:开 字号:中

第649章 玉泉路扛把子登顶榜首

下载APP,无广告、完整阅读
    第649章玉泉路扛把子登顶榜首(第1/2页)
    会议室里再次陷入了沉默。
    一个没有任何机构背景,用着中国大众邮箱,名字极其随意的队伍,直接把当前计算机视觉的最高记录翻了一倍。
    这听起来就像是一个拙劣的愚人节玩笑。
    但数据偏偏是铁打的事实。
    “有没有可能是我们自己团队的谁,不小心把内部测试的某个超前结果传上去了?”李飞飞抛出了第一个假设。
    约翰直接摇头。
    “不可能,李老师。”约翰苦笑,“我们团队现在最好的模型,昨天晚上刚跑完一轮,TOp-1才刚过30%。连人家的尾灯都看不到。这结果跟我们完全不在一个量级上。”
    “那会不会是测试集的标注答案泄露了?”大卫提出了第二个假设,“如果是有人拿到了标准答案,直接把答案改个名字上传,也能得到这个分数。甚至可以故意答错一些,控制在60%左右,避免百分之百太显眼。”
    李飞飞立刻看向陈冉。
    “陈冉,联系ImageNet项目的数据管理员,调取测试集所在的最高权限访问日志。我要看从发布到现在的所有记录。”
    陈冉立刻拿起手机开始打电话。
    会议室里的气氛压抑得让人喘不过气。
    如果真的是测试集泄露,那整个ImageNet项目的公信力将遭到毁灭性的打击。
    十分钟后,数据管理员把日志文件发了过来。
    陈冉打开文件,快速浏览。
    “没有泄露。”陈冉指着屏幕上的记录,“日志显示,测试集从发布到现在,只有三个经过授权的内部高级账号下载过。而且这三次下载记录,都是在项目启动初期为了做本地环境配置。最近三个月内,没有任何人访问过测试集原始数据所在的安全分区。”
    “黑客攻击呢?”大卫追问。
    “防火墙没有报警记录。”陈冉说,“而且我们的测试集服务器是不对公网开放的物理隔离节点,想要拿到数据,除非有人亲自跑到机房拔硬盘。”
    假设再次被推翻。
    “既然不是答案泄露,那这就见鬼了。”约翰双手抱头,“如果不是作弊,那这个正确率意味着什么?”
    大卫看着电脑屏幕上的乱码发呆。
    “意味着他们用的方法,已经跟我们不在同一个理论框架里了。”大卫说。
    “陈冉,你最了解中国那边的情况。”
    李飞飞问,“会不会是中国那边找了大量的人力,对着测试集一张一张标注出来的?重赏之下必有勇夫,为了那三万美元的奖金,这种人海战术在理论上是可行的。”
    陈冉还没说话,约翰先反驳了。
    “这绝对不可能。”约翰语气坚定。
    “为什么?”陈冉问。
    “ImageNet的分类不是区分猫和狗那么简单。”约翰语速飞快,“李老师,您忘了测试集的分类都是什么吗,一百二十种不同的狗!普通的数据标注工,哪能分得清诺威奇梗和凯恩梗?哪能分得清阿拉斯加雪橇犬和西伯利亚哈士奇在模糊背景下的区别?”
    约翰指着屏幕上的一个分类标签。
    “再看看植物类,普通标注工能看出一张带点反光的叶子到底是哪种蕨类植物吗?这需要专业的生物学知识!普通人盯着看一天也分不出个所以然。”
    约翰越说越激动。
    “要达到接近六成的TOp-1准确率,他们不仅需要找人看,还需要找动物学家、植物学家、汽车型号鉴定专家一起来看!普通人根本做不到这种精度,更不用说还要保证几千张图片的一致性了。”
    大卫在旁边跟着点头。
    “我算一笔经济账。”大卫补充说,“如果他们真的用人力标注,要请这么多专家来会诊十五万张图片,还要保证绝对的保密不走漏风声,这个成本早就远远超过了三万美元的奖金。逻辑上完全说不通。没有人会花三十万美元去赚三万美元。”
    (本章未完,请点击下一页继续阅读)第649章玉泉路扛把子登顶榜首(第2/2页)
    人海战术的假设也被彻底推翻。
    李飞飞深吸了一口气。
    “参赛系统是允许参赛队伍提交论文和源码的,对吧?”李飞飞问。
    “对,这是选填项。”陈冉点头。
    “我们看一下他们的详情页。”李飞飞说。
    四个人同时点进“玉泉路扛把子”这个ID的提交详情页。
    页面加载出来。
    论文栏,空着。
    源码栏,空着。
    算法架构说明栏,空着。
    只有那一份预测结果的EXCel表格,孤零零地挂在附件下载区里。
    约翰靠向椅背,双手摊开。
    “没有任何理论说明,没有任何代码实现,只有一个干巴巴的结果。”约翰盯着屏幕,“这怎么解释?魔法吗?”
    大卫摸了摸下巴。
    “就好像有人直接从未来把答案送过来了一样。”大卫说。
    会议室里再次安静下来。
    大卫这句无心的话,让陈冉觉得后背有些发凉。
    李飞飞站起身,走到会议室的白板前。
    她看着白板上之前画满的各种特征提取算法的流程图,觉得这些东西现在看起来就像是上个世纪的古董。
    “不管我们能不能理解,不管他们用了什么方法。”李飞飞转过身,看着会议桌前的三个人,“这个结果是真实存在的,它通过了我们所有的验证机制。”
    “那排行榜还更新吗?”约翰问。
    “如果不更新,我们就是在否定我们自己建立的评测体系。”李飞飞毫不犹豫地说,“更新。”
    “可是李老师,一旦这个数据放出去,北美这边的学术界可能就不只是炸锅那么简单了。”陈冉有些担忧,“大家会觉得我们这个榜单出了严重的漏洞。”
    “那就让他们去查漏洞。”李飞飞语气坚定,“科学就是在不断打破认知中前进的。既然有人做到了,我们就必须承认。”
    陈冉点头,手指放在了鼠标上。
    “我马上操作。”
    点击。
    确认。
    数据同步。
    于是,在2010年1月的这个上午。
    ImageNet挑战赛的官方排行榜,迎来了一次毫无预兆的刷新。
    让原本的榜单显得有些菜鸡互啄。
    顶替他们的,是一个全新的名字。
    第一名:玉泉路扛把子。
    TOp-1正确率:59.8%。
    TOp-5正确率:76.3%。
    原先排名第一的团队成绩是29%和69%。
    这两个指标之间的巨大鸿沟,大到让所有刷新页面看到榜单的人,都会以为自己的显示器出了故障。
    李飞飞合上自己的笔记本电脑。
    “陈冉,一会记得发一封邮件给那个QQ邮箱,邀请他们提交一下预测使用的方法。语气客气一些,但是要表达出我们迫切的渴望。”
    “不过我怀疑他们是有一些技术秘密不想透露,我们不一定能等得到他们的回信。”
    “所以,从今天开始,你手头其他的杂活先放一放。”李飞飞看着自己的学生,“密切关注中国那边所有和计算机视觉相关的实验室动向。”
    “中国那边的实验室?”陈冉问。
    “对。”李飞飞点头,“能做出这种成绩的,绝对不是几个散兵游勇。背后一定有一支顶级的团队,甚至可能是国家级的算力支持。只要他们还在做研究,就一定会发论文。有任何新的论文,或者相关的技术博客发布,第一时间整理发给我。”
    “明白。”陈冉说。

一秒记住【996小说网】
996xiaoshuo.com,更新快,无弹窗!

章节报错(免登陆)
下载APP,无广告、完整阅读
验证码: 提交关闭