有点令人感到害怕。
现在,AI只需任意一张照片,就能知道你在哪里,而且是可以精确到经纬度的那种!
例如下面这张非常随意的自拍照片,你能猜到小姐姐在哪里吗?
这事交给现在的AI来处理,它只需要“看”一眼,就能把照片里的“底裤都给扒出来”,即使是隐藏在背景中的。
美国,加利福尼亚州,旧金山机场洗手间,93号登机口附近的位置……
地理坐标:37.6189° 北纬,122.3744° 西经
再如下面这张照片,AI根据湖的特征、树木和背景中的山脉,就匹配到了玛丽湖,同样是给出了精准的坐标:
恐怖如此,恐怖如此。
至于这个AI工具,则是最近由一位俄罗斯黑客所推出,名叫GeoSpy,号称是可以根据照片里的各种细节(如建筑物、地标、街道等)做分析来判断地理位置。
该项目涉及到多个因素,包括光线状况、植物种类、建筑风格以及天气情况。研究人员还将这些因素与大量街景和地理照片进行对比,据说他们还使用了地理空间视觉大语言模型的技术。
而GeoSpy的功能,与之前一款基于谷歌地图的游戏GeoGuessr非常相似——
在游戏中,会呈现给玩家一张街景图,然后玩家需要在地图上找到该街景图的具体坐标位置;玩家给出的答案与正确坐标越接近,得分就越高。
之前也有一位国外小哥凭借只需看0.1秒街景,就能在世界地图上迅速确定位置而在网络上走红。
果不其然,斯坦福大学计算机系的学生Andrew Gao在尝试了GeoSpy之后,立刻开始向这位小哥发出呼叫:
你要失业了哦~
不过也有GeoGuessr的职业玩家感到不满,站出来表示不服:
我要申请参加一场战斗!
人类对抗人工智能
这位挑战者,名叫做Gavin(下文我们简称“G哥”),是一位正在参与GeoGuessr 2024世界杯的职业选手。
这位挑战者名叫Gavin,他是一位职业选手,目前正在参加GeoGuessr 2024世界杯比赛。G哥将他与AI在线对战的情况上传到了网上。
游戏规则和GeoGuessr相同,仍然是通过观察图片来猜测位置。
在第一轮对决中,G哥凭借观察到了马路道边上土耳其特有的样式柱子的细节,推测这张图可能是在土耳其附近。
根据结果显示,这张图所标示的位置确实位于土耳其附近,但与精确位置相比,还有241km的差距。
接下来就轮到GeoSpy这个人工智能选手登场了。
G哥处理的方式是将截图“投喂”给人工智能(AI),经过一段时间的等待,GeoSpy就给出了结果。
国家:土耳其(Turkey)
经纬度:39.998923, 32.607491
然后G哥在地图中搜索这个经纬度,再与GeoGuessr的“标准答案”进行比较:
第一轮的结果可以说是让G哥大受震惊,GeoSpy给出的位置比他的预测的位置更接近……来看下G哥当时的表情:
在接下来的“激烈对抗”中,G哥变得更加细致入微,都凑近屏幕去捕捉每一个细节了。
G哥这次给出的答案是苏门答腊岛,但实际的结果却不是很理想,距离“标准答案”足足703公里。
到了GeoSpy这边,虽然大致位置都是在印度尼西亚,但这次给出的位置就没有那么精确了。
不过与G哥给出的答案相比,AI的答案更接近实际情况,这让G哥开始感到有些无语……
在接下来的比试中,即便G哥把猜测距离压缩了86公里,但GeoSpy给出的结果又是更接近于“标准答案”。
G哥此时已经开始掩面了,表情非常难过。
在最后一轮battle中,G哥直接说出:
人类必须采取措施来对抗人工智能的威胁。
然后G哥把头埋得更深了,当他仔细观察到图中路边有一行清晰可见的文字时,脸上露出了得意的笑容:
这局稳了,人工智能它不具备阅读能力。
G哥的结果是,距离标准答案为134公里。
不过令G哥万万没想到的是,GeoSpy,它竟然能够识别文字!
这张照片是在波兰拍摄的,因为建筑物上写着“Abet”,这是一家波兰公司。
然而G哥还是觉得这把有希望,因为他发现GeoSpy只能定位到城市,而他认为可以进一步扩展定位的精确度。
所以如果AI给出的坐标是“标准答案”旁边的城市“华沙”,那么G哥就赢了。
结果还真是令人惊讶……G哥也是露出了久违的笑容,并自豪地说:
人工智能永远无法战胜人类!
(Emmmm……G哥,你非要这么算的话……也行。)
G哥在下一轮的比拼中,将地图范围缩小到了自己的故乡——芝加哥。
这次在自己的领域上,G哥的表现非常勇敢,取得了距离“标准答案”仅有2米和4米的成绩。
不过AI这边也是非常准确,至少在查看图片描述的过程中可以准确地提供周边的地址,这也让G哥着实担心。
但在地图上搜AI给出的坐标的时候,却比文字描述的地点远一些了,有的甚至还定位到了海上。
……
最后,G哥在与AI多次对决之后深有感触:
这次体验非常有趣、令人愉悦并且给人留下了深刻的印象。
但我也担心这样的技术在未来5年内会有怎样的发展。
也会经常出现意外事故
其实在刚才G哥体验的过程中,我们就能发现GeoSpy也存在一定的缺陷。
例如它更倾向于将地点定位到特定的城市,而不是具体的街道或建筑物,同时给出的经纬度坐标可能与文字描述的地点有一定的偏差。
网友们在实际体验过后也有相似的感受。
以至于许多人开始怀疑这个GeoSpy到底是不是凭借所谓的“地理空间视觉大语言模型”技术。
毕竟现在每张照片的背后就会有大量且丰富的信息:拍摄地点、拍摄时间、拍摄者等等。
但无论如何,这件事情倒是给我们敲了一个警钟——
技术的发展虽然日新月异,但我们也要时刻警惕数据安全的问题;平常一定要注意,不然一不小心就可能被黑客攻击。