抢票时,一个随处可见的验证码弹窗,你真的能一次选对吗?
换一张拼图,你敢说每次都能百分百对准吗?

甚至是一些简单的操作,比如打个勾,都可能需要尝试数次。

与验证码“斗智斗勇”这么多年,我们大多数人都感到一丝疲惫和无奈。
然而,如果我告诉你,现在这些我们费尽心思才能通过的验证码,已经无法阻挡人工智能(AI)的脚步,反而我们这些“纯人类”却屡屡被卡在这里,你相信吗?
就在不久前,我注意到,无论是需要点击选择的验证码,还是九宫格图形验证,甚至是行为分析类的隐式验证,AI agent 竟然都能够轻松通过。
最容易被攻破的,莫过于点击式的验证码。早在 OpenAI 的 Operator 模型在七月份推出后不久,就有人将其应用于对 Cloudflare 的测试。
让机器人自己完成“我不是机器人”的点击操作,这一幕实在令人啼笑皆非,许多网友对此表示了幽默的评论。
对于需要点选区域的九宫格验证码,有开发者直接利用 AI,通过与 GPT 模型后台连接,实现了像素级别的图像识别能力。
无论是识别饼干、蛋糕,还是楼梯、红绿灯,AI 都能以超越人类的精度和速度完成识别。
不仅仅是显式操作,隐式验证也同样难以阻挡 AI。用户仅需在命令行输入指令,AI agent 就能自行完成每一项点击、信息输入以及表格提交等任务。
令人惊讶的是,在一些 reCAPTCHA 的测试中,AI agents 甚至获得了高达 80% 的“类人”评分。
我们也进行了亲身体验,使用不同的 AI agent,对点击式和滑动拼图这两种验证码进行了测试。
需要强调的是,从打开网页到成功完成验证的整个过程,全部由 AI 操作完成,我们并未进行任何人工干预。
结果令人震惊,点击式的验证码对 AI 几乎没有形成任何阻碍。
对于滑动拼图验证码,AI 完成的速度和精度甚至超过了我个人,对方系统几乎没有做出任何反应。
回想过去,网络上常用来互相攻击的“人机”之说,如今看来,能够被 AI 模仿得如此逼真,或许“人机”已成为对人类能力的一种最高赞赏。
在亲身体验了 AI 轻松通过各种验证码的过程后,不禁让人产生疑问:如果验证码已经无法有效阻止机器人,那么它的存在价值又体现在哪里呢?
带着这些疑问,我们联系了国内领先的验证码技术服务商,极验(Geetest)的 CTO 谢强老师。他从验证码的原理、目的以及未来的发展方向,为我们进行了全面而深入的解答。通过这次交流,我们深刻理解到,验证码的复杂性远超我们表面所见。
采访结束后,我得出一个结论:这出“人机大战”,归根结底还是“道高一尺,魔高一丈”的较量,而在这场较量中,人类的“阴险”和创造力,显得尤为突出。
首先,要理解验证码的意义,关键在于了解它并非仅仅考验“对面”是人是鬼,而是从长远来看,成本才是决定一切的核心因素。
回溯到 AI 模型尚未成熟的早期,黑客破解验证码主要依靠“穷举法”。他们会通过特殊的算法获取网站上的所有验证码图像,然后将这些图像外包给人工进行识别和标注,也就是我们常说的“打码工”。
这是早期“打码工”的工作界面示例:
如果采用这种方式,黑客可能在短短 10 天内处理掉一个包含 30 万张图片的图库,平均每张成本仅为一分钱,总成本控制在四五百元左右。
而验证系统方的应对策略同样简单而有效:用高成本压垮黑客。目前国内的验证系统,图片库的更新频率极高,最快的可以在一小时内更新一次。这样的更新速度,即使是再精明的黑客也难以招架。
这种“以成本制胜”的策略,在 AI 时代依然适用。谢强老师指出,如今生成验证码的成本,远低于通过 AI 进行识别的成本。像自行车、红绿灯这类基于现实场景的图片验证码,多数大型模型都已具备了攻克能力。
但是,对于非现实、高度抽象的内容,大型模型则显得捉襟见肘。以谢强老师向我们展示的实验性验证码为例:它将人类的情绪融入图片,并由 AI 随机生成。这种验证码的生成成本大约在一毛钱左右,而若雇佣人工识别,每张的成本则需要三毛钱。

即使投入 AI 进行识别,成本也可能更高。这样的图片,即使收集 10000 张,新的 AI 模型也未必能完全学会。届时,可能需要从头开始训练一个全新的大模型,这对于一般的黑客而言,无疑是一笔巨大的金钱和时间投入,并非他们所能轻易承受。
“做题”仅仅是验证的第一层。系统的第二层防御,则体现在后台对用户 IP 地址的长期观察。一旦发现 IP 地址存在异常行为,系统会立即升级验证难度,使通关过程变得异常艰巨。
以观看视频为例,如果您在尝试解锁的过程中,多次触发“赛博保安”的拦截,这并非意味着您答题错误,而是您可能已经被标记为“高风险用户”。
来源:网络用户分享

一旦被系统盯上,轻则每次访问都需要进行数十道验证,并被限制访问流量;重则直接封禁 IP。尽管这可能误伤无辜的正常用户,但对于攻击者而言,他们也别无选择:要么乖乖接受验证,要么频繁更换 IP 地址,养护 IP,这无疑大大增加了他们的运营成本。
导致用户被系统盯上的原因多种多样。
例如,当用户使用一个身份(如 Chrome 浏览器)来访问验证码页面,却利用另一个身份(如 AI、小程序或 APP 挂机)来解决验证码时,系统通过 HTTP 交流记录会发现这些行为不匹配,从而触发防御机制,进行严厉打击。
来源:学术资料

因此,即便黑客们能够一次又一次地攻克验证码,只要这种模式能够让攻击者认为“这门生意不划算,成本太高”,那么验证码的存在就依然具有其战略意义。
然而,当前的防御手段有时也会“伤敌一千,自损八百”。
在验证环节,例如谢强老师提到的某种特殊验证码(“点击和右上角相同图案的选项”),直接让许多用户被“硬控”了一分钟。
这种类型的验证码是:点击和右上角相同图案的选项。

当面对这样的验证码时,用户是否有足够的时间和耐心去理解和完成?至少我个人,很可能会选择直接退出。
而过度依赖 IP 地址进行判断,则很容易误伤普通用户。比如,您使用的是公共 Wi-Fi,而近期大量使用该 Wi-Fi 的用户都在同一家公司网站进行了验证。系统识别到的信息是,该 IP 地址频繁发起大量请求,行为异常。
又或者,是在手机信号不稳定的情况下,用户的 IP 地址在 3G/4G/5G 网络之间频繁切换,这种不稳定因素也可能被系统判定为潜在的风险。
因此,谢强老师认为,未来验证码的发展方向将与业务数据紧密结合。
通过分析用户行为数据,才能更精准地区分出合法用户和恶意攻击者,从而避免对所有用户都施加繁琐的验证。毕竟,黑客破解验证码的根本目的,无非是为了恶意爬取信息,或是进行抢票、刷票等行为。在这些场景下,它们往往都会表现出一些共性,比如频繁访问网站或软件页面。
例如,用户随意浏览淘宝和爬虫程序“应爬尽爬”地抓取数据,对服务器造成的压力显然是不同的。
如果每个系统都能通过后台数据,观测并计算出每个用户对服务器造成的负担,从而精准识别出异常用户,那么系统就可以根据情况决定对该用户进行限制访问或收费访问,增加其成本,从而有效遏制攻击行为,同时又不影响正常用户的体验。
总而言之,这场“人机攻防战”并未因 AI 的崛起而画上句点,它只是将战场从我们熟悉的几种验证码形式,悄然转移到了更复杂اً的行为分析和成本博弈上来。
验证码作为一种工具,诞生于 1997 年,尽管年代久远,但它在未来也可能因为 AI 的冲击,而被更有效、无痛的拦截模式所取代。
然而,验证码或许会消失,人类与机器的边界识别问题将永远存在。我们期待着,能够早日迎来那个无需再亲手证明“我是人”的时代。











