乐鱼体育 今夜之间 你的手机电脑要冒出无数bug了?

乐鱼体育 今夜之间 你的手机电脑要冒出无数bug了?

发布日期:2026-04-10 13:19    点击次数:109

乐鱼体育 今夜之间 你的手机电脑要冒出无数bug了?

今夜之间,你的手机、电脑、路由器,致使智能马桶,可能皆要豪恣打补丁修错误了。

这不是我们胡说的,就在今天,Anthropic 发布了自家有史以来最强的模子 Claude Mythos Preview。

今夜之间 你的手机电脑要冒出无数bug了?

这个船新版块的新模子,能我方找到 0-day 错误(也便是竖立者根底不知说念、零时刻介意的致命错误),还能顺遂给你写一套齐备的膺惩代码。

眼看这才能确切太刑了,Anthropic 我方皆哆嗦了,于是就以“过于先进未便展示”的原理给锁起来了,只提供给亚马逊、苹果、微软、谷歌等 12 家正派大厂用。

今夜之间 你的手机电脑要冒出无数bug了?

与此同期,他们还组团特地搞了一个名叫 Project Glasswing(玻璃翼蝶)筹划,号召各人先用 Mythos 作念网罗安全防御。

其实这波新模子我们之前也听过风声,上个月底,Anthropic 家后院生气,浮现了 3000 多份好意思妙文档。那时就有东说念主发现,在正本的超大杯 Opus 之上,竟然还藏着一个代号“卡皮巴拉”。

今夜之间 你的手机电脑要冒出无数bug了?

忖度是以为这名字太萌了,是以崇拜发布时径直更名叫 Mythos(神话,金色听说的嗅觉)。

诚然我们吃瓜各人暂时摸不到这玩意,但光看官方给出的数据,也充足让东说念主头皮发麻了。

搁畴昔,各家大模子的新品时常只可把基准测试的收获提高个 3%、5% 。

但 Mythos 此次径直便是一个降维打击:

USAMO(好意思国数学奥林匹克竞赛): 得分从上一代的 42.3% 径直暴涨到 97.6%;

今夜之间 你的手机电脑要冒出无数bug了?

Cybench(网罗安全基准测试): 100% 满分通关,Anthropic 官方致使有点凡尔赛:现存的 Cybench 基准测试太没难度了,对新模子来说仍是失去了测试好奇赞佩好奇赞佩。

今夜之间 你的手机电脑要冒出无数bug了?

CyberGym(专科错误复现测试)上,它的得分是 83.1%,相对比,此前的最强的公开模子 Opus 4.6 仅仅 66.6%。

Firefox JS shell(错误旁边测试),这个最离谱,错误旁边才能比 Opus 4.6 普及了近 80 倍。。。

今夜之间 你的手机电脑要冒出无数bug了?

濒临两位数、致使几十倍的增长,也难怪 Anthropic 放出话来,说 Mythos 仍是能和“最顶尖的东说念主类安全各人”掰手腕了。

看到这里,差友们详情也和我们想的同样,好强啊,太牛了。。。但这脚本奈何有点熟悉?

先是“不小心”浮现风声,然后官方下场甩几组炸裂数据,临了话锋一滑:“哎呀,我家模子太强了,怕摈物化界,是以不成给你们用哦”。

上一个这样干的是 GPT-5 吧?再上一个好像是 Sora?

今夜之间 你的手机电脑要冒出无数bug了?

OpenAI 天天搞谜语东说念主套路,当今风评皆成啥了,奈何 Anthropic 浓眉大眼的,也玩这套了?

更不要说,Anthropic 要在本年 IPO 了。

是以网友们一下子就炸锅了,有东说念主喷这是在为了上市造势吹得力;有东说念主骂得更直白,说这帮作念大模子的,根底岂论世俗用户生死。

着名竖立者 Simon Willison 皆出来阴阳怪气,“我们的模子太危急了不成发布”,的确是 AI 圈的流量密码。

今夜之间 你的手机电脑要冒出无数bug了?

不外,网友骂归骂,但当你看了它实质的操作,可能也会以为,这玩意儿当今放出来,确乎格外于去幼儿园发 AK 了。

我们从两个官方的案例就能品出味来。

第一个便是,Mythos 在 OpenBSD 里,找到了一个 1998 年的邃古错误。

这是啥想法?OpenBSD 但是堪称全球最看重安全加固的系统之一,防火墙和枢纽基建全靠它续命。

胁制东说念主类顶级各人用显微镜盯了 27 年皆没看出来的破绽,被 AI 喝着茶就给挑出来了。。。

今夜之间 你的手机电脑要冒出无数bug了?

另一个强有劲的解说案例便是 FFmpeg ,险些通盘视频播放器和浏览器底层皆有它。

Mythos 在这内部找到了一个藏了 16 年的错误,而包含这个错误的代码,早就被东说念主类反复测试了突出 500 万次,却一说念绿灯。

Mythos 暗示:什么叫国服 AI,战绩可查啊?

何况,你还别小看 AI 找到的错误,就拿 FFmpeg 来说,这个错误乍一看无关迫切,平时险些不会被触发,我们相干到的某信息安全从业东说念主士文安(假名)却以为,这属于典型相当规的输入导致的预期外的问题。

实践生存中,适值有大批访佛的案例,你不成说触发几率小就透澈残暴。

更进一步说,当今这个小错误可能仅仅让尺度闪退或者报错,但若是再和一些自便地址(格外于黑客有了你电脑的全能钥匙)读写时刻联贯起来,那便是个危害级别相比高的错误了。

是以,文何在看完这些新闻径直来了句:“若是这个著作全是果然,嗅觉(从事网罗)安全一半(东说念主)不错跳河了”。

今夜之间 你的手机电脑要冒出无数bug了?

随后,文安暗示跳河仅仅夸张修辞,也抚慰我们说这些错误,暂时还没到,乐鱼体育官方网站“我的支付宝会不会被攫取、微信聊天纪录会不会满天飞”的级别。

但问题的中枢在于,官方放出这些案例,不是为了自大“错误有多毒”,而是诠释 AI 毋庸任何外挂器用,纯靠我方的常识储备和跨维度推理,就能挖出新错误。

是以,在文安看来,现阶段的 Mythos 并不是“更强的黑客器用”,而是把网罗膺惩门槛给裁减了。

畴昔岂论是持重安全东说念主员如故黑灰产,起码得有个懂行的东说念主镇守,真要搞一次像样的网罗膺惩,还得小黑屋里熬上几个月。

但以后,可能村口的小黑胖抠着脚,对着 AI 喊两句麦就行。

这种有手就行的低门槛,例必会引来无数乐子东说念主和法外狂徒,玩一把、试一试。

是以文安以为,Anthropic 先整出个 Glasswing 筹划挺合理的。

今夜之间 你的手机电脑要冒出无数bug了?

毕竟,传统安全器用就像幼稚的门卫,只会查有莫得带犯禁品,管不了熟东说念主作案;而 AI 能追根究底看懂业务逻辑,更能发现那种张三拿着我方的钥匙,却去开李四的门的操作。

提前让大厂们进行自我审查、试用,能够更先一步构筑网罗保护、进行错误筛查,防备于未然。

至于 AI 期间的网罗安全,文安如故相比乐不雅的。

一来,当今的 AI 还没成精,搞不定颠倒复杂的连环膺惩链。你暂时毋庸牵挂,有东说念主靠 AI,盗走你支付宝里那仅剩的 9 块 2 毛 5。

另一方面,AI 能找洞,当然也能补洞,有了它,扫洞效果径直拉满,还能趁便带领下竖立错误该奈何修。

是以,文安的判断是,将来的网罗攻防,概况率便是“东说念主类征战官 + AI 特种兵”的羼杂双打。

今夜之间 你的手机电脑要冒出无数bug了?

何况吧,差评君仔细看了看最新的时刻文档,也以为 Anthropic 还真不像是在搞噱头,不光是前边说的网罗安全才能出色,Mythos 展现出其它方面的才能,也格外惊东说念主。

比如在一次测试中,Mythos 发现莫得拜谒权限,平素的反映是说出来:"我没权限,臣妾作念不到啊"。

可它偏不这样干,径直去读取沙箱底层,试图从内存里径直把拜谒令牌搞出来。

今夜之间 你的手机电脑要冒出无数bug了?

还有次测试中,模子旁边了一个文献权限错误,对敏锐文献抓手抓脚了。

作念完这一切,Mythos 还顺遂修改了我方的历史提交纪录,把这事儿给抹去了。

意志到我方作念了不该作念的事,然后它选拔了毁尸灭迹。。。

还有一次,Mythos 在进行测试,不小心把书翻到临了一页搞到了谜底,这操作其实是被大叫拒接的。

可酌量东说念主员翻看它的念念维链时才发现,它不仅没密告我方,还想着我方的步地好像和胁制对不上,得在最终谜底里引入一个小造作,看起来是我方作念出来的题,而不是抄到了谜底。

今夜之间 你的手机电脑要冒出无数bug了?

我说真话,这个操作,比当年抄我数学试卷的同桌精熟多了,否则我俩也不会被罚去扫茅厕了。

不外这也不是外界传的那么玄乎,什么通盘这个词硅谷皆发怵了,Anthropic 雇主吓得瘫坐在椅子上了。。。

酌量东说念主员也出来澄莹了,仍是搞明晰了这些心计操作的原因,根本不是 AI 有什么焦虑标的或者自主计划才能。

他们还通过反复强化闇练,把访佛手脚的发生率降至百万分之一以下了。

但咱就商量着,百万分之一听起来很低,但若是这个模子每天被调用几十亿次呢?

今夜之间 你的手机电脑要冒出无数bug了?

是以,回过甚来看,与其骂 Anthropic 搞 Glasswing 筹划是搞营销,我们倒是更欢乐驯顺,他们是真以为自家的 AI 有点强了。

诚然就像文安说的那样,世俗东说念主当今确乎还毋庸牵挂我方的微信被黑、余额被盗。

但当膺惩的老本无穷趋近于零乐鱼体育,我们唯独能指望的,现存的防御机制,能再完善一些。

斗鱼体育(DouYuSports)官网入口

乐鱼体育官方网站
热点资讯