Google 驗證碼進化史:我們越來越方便,但也交出了越來越多的隱私

更新時間:2019年07月10日 23:09    來源:愛范兒    手機版我要報錯

即使現在互聯網已經滲透到我們生活的方方面面,但它依然只是現實的物理世界在虛擬的網絡空間上按比特信息編碼后的投射。

這就意味著自動化程序同樣可以模仿人的行為,同時,因為機器速度更快且不知疲倦,它會被用于批量在論壇、網站、app 中發布營銷信息。而且,在監管不足的情況下,利潤更高的行業往往底線更低,自動機器人發布的垃圾信息經常也和賭博、詐騙、色情等灰色產業有關。一些自動化程序還會嘗試以「撞庫」的方式竊取用戶帳號、密碼,給網站帶來巨大的安全隱患。

驗證碼正是為了解決這樣的問題而生的。它也是個自動化程序,不過存在目的是區分用戶到底是機器人還是真實的人。

自動生成的扭曲的文字和圖案是最常見的驗證碼,雖然它可以有效地識別出很大一部分自動化程序,但它對真人用戶的體驗并不好。而且隨著機器學習的發展,它的破解也越來越容易。

Google 的驗證碼團隊做了很多創新,比如創造性地把驗證碼用于紙質典籍數字化。而在扭曲文字、圖片的主流路線之后,Google 的團隊還嘗試了新的思路,通過追蹤點擊行為等來識別用戶是否是真人,用戶只需要點擊「我不是機器人」的復選框進行驗證即可。

在最新版本的 Google 驗證碼 reCAPTCHA v3 中,你甚至什么都不用做,系統就在悄悄核驗當前的用戶是不是機器人。技術正在讓「驗證碼」越來越隱形,人類不必再為了自證身份去做「反向圖靈測試」,但驗證碼的進步也帶來了一些新的問題。

初代驗證碼 CAPTCHA:歪歪扭扭的文字是為了故意讓機器人看不懂

卡內基梅隆大學校舍不大,學校排名也和常春藤盟校也有一定差異,但它有全美排名第一的計算機科學專業。

這所學校出了 13 名圖靈獎得主,其中的一位,Herbert Simon 還因為把計算機科學和系統理論、運籌學結合用于管理決策問題,開創了「決策理論」而在 3 年后獲得了諾貝爾經濟學獎。

在嚴肅的學術研究之外,卡內基·梅隆大學還有一些對計算機和互聯網行業影響深遠的「小發明」,比如給了 emoji 產業靈感的第一個笑臉符號 :-),以及「煩人」的驗證碼。

2000 年,從杜克大學數學系畢業,來到卡內基梅隆大學讀計算機科學博士的路易斯·馮·安(Luis von Ahn)和導師一起提出了驗證碼的概念,全稱是全自動區分計算機和人類的公開圖靈測試(英語:Completely?Automated?Public?Turing test to tell?Computers and?Humans?Apart,簡稱 CAPTCHA)。

圖靈測試由計算機先驅人物,「人工智能之父」阿蘭·圖靈提出,如果一臺計算機能和人類對話而不被識別出是機器人即被認為通過圖靈測試。驗證碼也是一種圖靈測試,不過它的目的不是為了篩選出人工智能,而是識別出真實的人類用戶。

一種最常見的驗證碼是由算法生成的扭曲的文字,這么做是為了防止被光學字符識別程序(OCR)自動識別出來。

還有一些更現代的方法包括在字母上加一條曲線、將不同的字母疊在一起或者添加復雜的背景。

圖片驗證碼也大行其道,包括要求用戶識別圖片的物體,以及把缺失的部分拖到正確的位置和拼圖等。

不管形式如何,這些驗證碼有一個共同的原則:人類很容易識別,但對計算機來說非常困難。一位人工智能研究者在自己的播客中有一個更詳細的解釋,為避免 CAPTCHA 過難而使網站損失用戶,通常要求人類用戶通過測試的時間小于 30 秒,用戶通過率大于 90%(引用自CSDN 用戶 ?luolan9611)。

還有一個不被普通人知道的點,驗證碼被稱為一種「圖靈測試」,所以它在設計之初就有促進人工智能發展的初衷。

根據定義,驗證碼的算法必須公開,這樣做的目的是為了讓破解驗證碼的過程是在解決對應的人工智能問題,例如圖像識別、準確度更高的 OCR 等,破解者不必花費心思通過逆向工程推演算法。

再次引用上文提到的研究者的博文:

CAPTCHA 機制的研究是一個雙贏的局面。CAPTCHA 的設計和破解研究呈現出「設計 – 識別 – 再設計 – 再識別」的互相攀升現象,促使 CAPTCHA 研究不斷向前發展,從而帶來 CAPTCHA 機制的魯棒性和可用性的不斷提升。

reCAPTCHA:驗證碼還能用于紙質典籍數字化

驗證碼發明人路易斯·馮·安除了是個計算機科學家,還是一位企業家,但是是那種相信人性美好,希望借助技術,在創造商業價值的同時能附帶創造社會價值的人。

馮·安的博士論文完成于 2005 年,他創造了一個新概念「人本計算」(Human-based Computation),即把人的腦力和計算機的能力結合起來,完成兩者都無法單獨完成的工作。具體的實現方式上,「眾包」是最典型的一種,馮·安也被工人是眾包的先驅。

不僅是理論提出者,馮·安也是實踐的先驅。驗證碼已經被廣泛用于各大網站、app 中,有數據顯示,這項技術在推出后的短短五年內,每天就有 2 億個驗證碼在被使用。

很快,他提出一個新的項目 reCAPTCHA,主要用于把互聯網出現前的紙質典籍數字化。思路是這樣的:驗證碼系統會向用戶出示兩個單詞,第一個是正常的自動生成扭曲文字,另外一個則來自紙質典籍的掃描版,它們通常因為年代久遠、紙上有污點等原因難以被 OCR 程序識別。

用戶輸入驗證碼時,只要第一個單詞輸入正確就可以被判別為人類,輸入第二個單詞就成了「義務勞動」。系統會默認這個單詞輸入正確,并與其他用戶的輸入結果進行對比,如果多名用戶的答案一致,這個詞的數字化就完成了。

不要小看這樣一個詞一個詞的積累,推出之初,reCAPTCHA 每天就能錄入 3000 萬個字符。2011 年,它已經完成了全部的《紐約時報》數字化的工作,這份從 1851 年開始出版的老報紙有大量純紙質版的內容。

2009 年,Google 看上了這個項目的價值,并出手收購了 reCAPTCHA,它也被 Facebook、Twitter、CNBC 等使用。在幫助這些流量最大的網站抵御自動化程序騷擾的同時,Google 圖書中難以被自動識別的掃描版的古老典籍同樣借助 reCAPTCHA 得以數字化。

此后,reCAPTCHA 還被用于幫助機器學習系統提高圖像識別率,運作原理和前述方法一樣,機器難以辨別的門牌號、貓狗照片都被拿來當做驗證碼考人類。

識別驗證碼的同時,用戶實際在幫機器學習系統標注訓練集,所以,AlphaGo 背后的人工智能技術,可能早就有你的功勞。

順便提一下,在 reCAPTCHA 被 Google 收購后,馮·安還有很多基于「人本計算」的項目,比如「帶著目的玩游戲」(Games With A Purpose,簡稱 GWAPs),游戲由兩個人同玩,如果兩名玩家對一張圖片的描述一致即可得分,實際上,游戲的同時也在給人工智能標注數據。

2014 年,馮·安創辦了一家更知名的公司——多鄰國(Duolingo),這個學外語的應用同樣采用「眾包」的模式,用戶在免費學習一種外語時,也在反過來協助建構多鄰國的語言課程,讓其他人也能多學習一種語言。

NoCAPTCHA:不用輸入字符的新驗證碼,以及它帶來的隱私風險

一家公司的「基因」通常和個人一樣,與生俱來難以改變。

收購 reCAPTCHA 后,Google 對它進行了改進,以 Google 的方式。

2014 年,Google 推出了新的驗證碼系統——NoCAPTCHA reCAPTCHA,名字有點拗口,核心是不需要輸入驗證碼的驗證系統,用戶只需要點擊一個「我不是機器人」的復選框,Google 就能判別你是不是真正的人類。

reCAPTCHA 的口號也從「別發垃圾信息了,讀點書吧」(Stop Spam. Read Books),變成了驗證碼最初的目的「對人類簡單,對機器人困難」(Easy on Humans, Hard on Bots)。

NoCAPTCHA 的工作機制是跟蹤用戶點擊驗證框之前、當時和之后的行為,比如在網頁上花費的時間,從而來判斷是否是人為操作。

如果你被誤判為機器人,還有一個「申訴」的機會,還是從一堆圖片中選出正確的目標。

2018 年,Google 再次升級了 reCAPTCHA,在這個被稱為 v3 的版本中,用戶已經連「我不是機器人」的復選框也看不到了,系統會在背后悄悄分析用戶瀏覽網站的方式,并根據其行為的惡意程度給出一個風險評分。如果用戶評分過低,網站可能會要求用戶輸入更多的信息來證明自己的身份。

目前,已經有 65 萬個網站使用了最新的 reCAPTCHA v3,而使用 reCAPTCHA 的網站超過了 450 萬,包括 top 1000 網站中的 25%。

在 Google 看來,這是最好的體驗,用戶不需要任何輸入,而且它很難被破解程序學習。唯一的問題是,Google 掌握了越來越多的用戶隱私。

據 FastCompany 報道,兩位研究者對 reCAPTCHA v3 進行了測試后發現,用戶是否使用 Google Cookies 是決定評分的一個重要因素。也就是說,如果用戶選擇讓 Google 記住登錄信息的話,會得到更高的分數,沒有登錄 Google 帳號,或者使用 VPN 或者洋蔥瀏覽器通常會被提示高風險。

另外,使用 reCAPTCHA v3 的網站被鼓勵在網站的每個頁面放置 reCAPTCHA v3 代碼,而不只是在登錄頁面,因為 reCAPTCHA 系統會跟蹤用戶的所有瀏覽行為進行分析。

兩個因素結合,Google 可以獲得幾乎所有的用戶行為。在 FastCompany 的報道發出后,Google 確認,用戶使用的硬件信息即設備上的軟件會被發送回 Google 服務器,但它表示,獲得的結果「只用于分析用戶行為,不用于個性化廣告推薦」。

2018 年,Facebook 遭遇了史上最大的危機,除了商業上的廣告收入增速放緩,在監管和公眾層面,作為最大的社交網絡和在線廣告公司之一,Facebook 對用戶隱私保護不力激起了前所未有的質疑。Google 也牽連其中。但一個不可逆轉的趨勢是,我們的一舉一動都在被互聯網巨頭「記錄在案」,從這個層面來看,在隱私保護上,監管部門應該對大公司有更高的要求。


文章轉載自網絡,作者觀點不代表本網站立場,如需處理請聯系客服

愛范兒其它文章

DVD 還沒死,Netflix 剛剛租出了第 50 億張 DVD

DVD 還沒死,Netflix 剛剛租出了第 50 億張 DVD

盡管今天我們追劇看綜藝基本都是在視頻網站,但 DVD 并沒有被流媒體完全淘汰。就在不久前,美國最大的流媒體平臺 Netflix 宣布,已經租出了第 50 億張 DVD。很多人可能都沒想到,Netflix 時至今日還沒有放棄 DVD 租賃業務,為什么?有錢賺唄。很多人都知道,Netflix 最開

2019年08月28日 05:20
專訪魅族 Flyme 負責人周詳:我們不會滿足現在的 90 分,永遠追求 100 分

專訪魅族 Flyme 負責人周詳:我們不會滿足現在的 90 分,永遠追求 100 分

當我到達珠海魅族大樓的時候,正好是 Flyme 團隊的午休時間,燈光熄滅窗簾拉上的魅族辦公室深沉而安靜。過了半個鐘頭,和魅族 Flyme 負責人周詳約定的專訪時間到了之后,我從休息室去往周詳辦公室剛好路過 Flyme 員工們的辦公區。此時又是另外一種景象:拉開窗簾開啟燈光

2019年08月28日 09:04
專訪魅族 Flyme 負責人周詳:我們不會滿足現在的 90 分,永遠追求 100 分

專訪魅族 Flyme 負責人周詳:我們不會滿足現在的 90 分,永遠追求 100 分

當我到達珠海魅族大樓的時候,正好是 Flyme 團隊的午休時間,燈光熄滅窗簾拉上的魅族辦公室深沉而安靜。過了半個鐘頭,和魅族 Flyme 負責人周詳約定的專訪時間到了之后,我從休息室去往周詳辦公室剛好路過 Flyme 員工們的辦公區。此時又是另外一種景象:拉開窗簾開啟燈光

2019年08月28日 09:04
外媒上手 Switch Lite:便宜但不廉價

外媒上手 Switch Lite:便宜但不廉價

Switch Lite 是任天堂在今年 7 月發布的一款掌機,199 美元的定價無疑比原版 Switch 便宜不少,但功能和硬件上的削減也讓不少玩家有所猶豫。在距離正式發售還有不到一個月之際,一些外媒在紐約洛克菲勒中心的任天堂活動上提前體驗到了這款「平價版 Switch」,這篇上手或

2019年08月28日 09:58
外媒上手 Switch Lite:便宜但不廉價

外媒上手 Switch Lite:便宜但不廉價

Switch Lite 是任天堂在今年 7 月發布的一款掌機,199 美元的定價無疑比原版 Switch 便宜不少,但功能和硬件上的削減也讓不少玩家有所猶豫。在距離正式發售還有不到一個月之際,一些外媒在紐約洛克菲勒中心的任天堂活動上提前體驗到了這款「平價版 Switch」,這篇上手或

2019年08月28日 09:58
外媒上手 Switch Lite:便宜但不廉價

外媒上手 Switch Lite:便宜但不廉價

Switch Lite 是任天堂在今年 7 月發布的一款掌機,199 美元的定價無疑比原版 Switch 便宜不少,但功能和硬件上的削減也讓不少玩家有所猶豫。在距離正式發售還有不到一個月之際,一些外媒在紐約洛克菲勒中心的任天堂活動上提前體驗到了這款「平價版 Switch」,這篇上手或

2019年08月28日 09:58
魅族 16s Pro 體驗:不從眾的 Android 旗艦,2699 元是驚喜

魅族 16s Pro 體驗:不從眾的 Android 旗艦,2699 元是驚喜

經過一年的打磨,魅族 16s Pro 發布了。和魅族 16s 一樣,更新后的魅族 16s Pro 在外觀上還是走「不從眾」的路線。在一眾異形屏旗艦中,魅族這塊完整且標準 18.6 :9 全面屏就成為了 16s Pro 的亮點。換上了高通驍龍 855 Plus 和后置三攝之后,魅族 16s Pro 也擁有了和下

2019年08月28日 10:06
魅族 16s Pro 體驗:不從眾的 Android 旗艦,2699 元是驚喜

魅族 16s Pro 體驗:不從眾的 Android 旗艦,2699 元是驚喜

經過一年的打磨,魅族 16s Pro 發布了。和魅族 16s 一樣,更新后的魅族 16s Pro 在外觀上還是走「不從眾」的路線。在一眾異形屏旗艦中,魅族這塊完整且標準 18.6 :9 全面屏就成為了 16s Pro 的亮點。換上了高通驍龍 855 Plus 和后置三攝之后,魅族 16s Pro 也擁有了和下

2019年08月28日 10:06
發熱的衣服材料還能防止蚊子叮咬?石墨烯材料防蚊有雙重保護

發熱的衣服材料還能防止蚊子叮咬?石墨烯材料防蚊有雙重保護

食物」——血液的化學信號,從而抑制蚊子叮咬的沖動。研究結果表明,除了能夠物理防蚊,石墨烯制成的服裝可能還有化學防蚊的效果。...

2019年08月28日 11:34
理想 ONE 有一臺理想的車嗎?

理想 ONE 有一臺理想的車嗎?

理想汽車,可以說是今年最被寄予厚望的新造車玩家。在量產交付前兩個月,理想汽車對媒體開放了首款量產車理想 ONE 的道路試駕,按前期的媒體聲音來看,可以說好評的「一塌糊涂」。以至于董車會的讀者朋友明確要求我「先說缺點」。前文有必要先交代一下,這次理想拿出來的

2019年08月28日 15:37
創維發布了兩款新電視,全面布局 AIoT 家電生態

創維發布了兩款新電視,全面布局 AIoT 家電生態

今年科技行業出現了個大趨勢,手機行業開始轉型去做電視了,而傳統的電視企業開始轉型去打造 AIoT。一時間,國內 90% 的科技企業都在朝著 AIoT 這個目標進發,不是已經形成一套生態就是在研發生態的路上,即便是老牌科技公司,也開始轉型進入 AIoT 智慧家居生態的隊列當

2019年08月28日 16:13
索尼又雙叒叕發新相機和鏡頭了,半幅大光圈標變和 APS-C 旗艦微單終于出現了

索尼又雙叒叕發新相機和鏡頭了,半幅大光圈標變和 APS-C 旗艦微單終于出現了

8 月 28 日晚,索尼又再推出兩款 APS-C 畫幅的微單相機 α6600 和 α6600。和之前預測的一樣,α6600 的機身設計更貼近新一代 α7 系列機身。α6600 擁有尺寸更大的握持手柄,這能夠為握持提供更貼服的手感。除此之外,更大的手柄也是為了能夠容納尺寸更大的電池,所以

2019年08月28日 17:36
蘋果就監聽用戶隱私錄音道歉/Apple Watch 5 或配備血壓監測/董明珠要和雷軍再賭 5 年

蘋果就監聽用戶隱私錄音道歉/Apple Watch 5 或配備血壓監測/董明珠要和雷軍再賭 5 年

蘋果為監聽 Siri 錄音事件道歉近日,《衛報》的一篇報道指出,蘋果為了提高人工語音助手 Siri 的技術質量,允許第三方承包商收聽用戶的 Siri 錄音,內容甚至包括夫妻性生活以及私人醫療等敏感信息。針對此事,蘋果于昨天正式發出道歉:我們意識到我們還沒有完全實現我們

2019年08月29日 00:51
馬云 VS 馬斯克對話全文實錄

馬云 VS 馬斯克對話全文實錄

正在舉行的 2019 世界人工智能大會(WAIC)上,自嘲為「火星人」的馬云和「未來的火星人」埃隆 · 馬斯克(Elon Musk)針對人工智能、宇宙、教育、人類命途等話題上演了一場精彩對話。以下是現場對話全文 (視頻點這里):話題一:AI馬斯克:我覺得未來的科技發展變化,將

2019年08月29日 06:33
阿迪達斯要把粉絲變成自己的銷售員

阿迪達斯要把粉絲變成自己的銷售員

從全球來說,我們最重要的門店是「.com」。 —— 阿迪達斯 CEO Kasper R?rsted就這一句話,我們就能看出網絡銷售在戰略層面上對阿迪達斯多么重要。Kasper R?rsted,圖片來自 《華爾街日報》據悉,阿迪達斯線上銷售為增長最快的渠道,在 2018 年財年中就上升了 36%。公

2019年08月29日 07:02
一顆馬達值多少錢?對戴森來說,答案是 3.5 億英鎊

一顆馬達值多少錢?對戴森來說,答案是 3.5 億英鎊

不用拖著電線到處走的手持式吸塵器,沒有葉片的風扇,以及看不到細長風嘴的電吹風……每當人們看到戴森的產品時,總會心生疑問,為什么它們的設計總能那么的與眾不同?那顆內置的數碼馬達,就是戴森的答案。本周三,戴森在北京舉辦了一場活動,將 798 藝術中心的一棟大樓

2019年08月29日 07:11
互聯網公司用技術讓用戶上癮?全球首部與此相關的法律提案也來了

互聯網公司用技術讓用戶上癮?全球首部與此相關的法律提案也來了

「科技成癮」論還沒站穩腳跟,全球首個要求互聯網公司限制使用技術讓用戶上癮的法律提案出爐了。7 月下旬,美國一位在科技界頗有影響力的議員喬希 · 霍利(Josh Hawley)提出了一項關于限制互聯網公司使用心理學、腦科學等成果讓用戶上癮的法案。該法案名為《降低社交媒

2019年08月29日 07:38
國外的門鈴成了快遞業中的重要一環

國外的門鈴成了快遞業中的重要一環

國內發達的快遞業給了用戶足夠方便的選擇。雖然快遞箱到底是方便了快遞員還是方便了用戶的爭議一直都在,偶爾也會曝出快遞員偷拆快遞、快遞公司刷單、暴力運輸致貨物有損的新聞。但總的來說,國內的快遞業服務水平一直都在及格線以上。全世界快遞服務業要是個大班級的話

2019年08月29日 07:58
華米科技再發三款新品,全面產品布局徹底治好選擇困難癥

華米科技再發三款新品,全面產品布局徹底治好選擇困難癥

當華米科技創始人&CEO 黃汪在華米發布 2019 年 Q1 財報電話會議上宣布,接下來的幾個月時間里他們將發布超過 10 款智能手表的時候,很多人還在想,這么多的產品將會以何種節奏發布,會不會像當年楊坤的 32 場演唱會一樣只是口嗨而已?然后,這家曾經和小米一道把運動手環

2019年08月29日 11:42
相差 1400 元,為何我會說 Galaxy Note 10+才是三星真旗艦

相差 1400 元,為何我會說 Galaxy Note 10+才是三星真旗艦

三星在本周早些時候發布了 Galaxy Note 系列,但和過去不同的是,今年三星在該系列上走的是一大一小的雙機戰略。當然這也不讓人意外,畢竟年初僅 Galaxy S10 一款手機就有三個版本,在當前手機市場已經飽和的狀態下,手機廠商需要更靈活地調整策略去保障市場銷量。哪怕是

2019年08月25日 09:28
愛范兒
愛范兒

最新文章

更多>>
株洲长沙麻将群
下载四川成都麻将 天天捕鱼游戏官网8 怎么利用定额发票赚钱 麦当劳如何赚钱论文 免费淘小说赚钱软件下载 360江西时时彩走势图 网上德州扑克赚钱 北京麻将胡法图解 河南快3走势图_快3开奖走势图 北京赛车pk10玩法 全民穿越之宫赚钱 赚钱宝 现在还赚钱吗