Google 的智慧鏡頭、Google Lens 可以下載了!


「Google Lens」是 Google 在 Google I/O 2017 發表的一款「智慧相機」(維基百科);它的基本概念是讓透過手機的鏡頭來進行分析,進而提供使用者關於目前看到的畫面的進階資訊。

而類似的應用,其實之前 Google 就有推出「Google Goggles」這款 App(Google Play),另外像是 Sony 也曾經有在部分手機內建「Info-eye」這個 App(參考、Heresy 上一支 Z1 Compact 就有內建),都算是類似的東西。

不過,相較於這些比較舊的 App 來說,Google Lens 的功能應該算是更為強大,所以在發表後,其實 Heresy 也滿期待的。

但是在初期,Google 僅提供自家的 Pixel 系列手機使用,其他的 Android 手機並無法使用…直到前一陣子,Google 才正式開放其他家的手機,可以使用這項功能。

像前幾天,Sony Xperia XZ2 也在自家的相機內整合了 Google Lens 的功能,讓 Heresy 滿想 root 去刷新的相機試試看。(參考:《【試玩文】Sony XZ2 開放支援 Google Lens 讓你的相機智慧再進化》)

而現在,Google 也正式在 Google Play 放出 Google Lens 的獨立 App,讓大家可以下載使用了!他的中文名稱是「Google 智慧鏡頭」,網址是:

https://play.google.com/store/apps/details?id=com.google.ar.lens

不過,似乎不是所有的手機都可以正常使用,所以可能還是要試試看才知道了。
(參考:《Google Lens 可從 Google Play 上下載囉!Sony、三星、HTC 多款裝置可使用》)


Screenshot_20180605-130532Heresy 的 Sony Xperia XZ1 Compact 看來是可以正常使用,所以這邊就簡單貼一下使用的狀況了~

首先,和「Google 助理」(Google Assistant)目前還不支援中文不同,Google Lens 目前是可以在台灣的中文環境使用的。

而它能偵測的東西,包括了畫面中的:

  • 文字
  • 產品
  • 書籍與媒體
  • 地點
  • 條碼

其中,最簡單的應該就是條碼了。不管是一維條碼還是 QRCode,其實都算是相當簡單、好分析的東西。

而文字的辨識,其實也算已經發展到了相當的程度了。但是剩下的東西,就不見得是那麼好處理的了…

在使用時,就是開啟「智慧鏡頭」這個 App,然後把鏡頭對準要辨識的東西,然後靜止一段時間,如果畫面有出現圈圈(似乎還會有不同的顏色),就代表有偵測到東西了~像下方左圖,就代表他有偵測到兩個可以辨識的東西。

Screenshot_20180605-205115 Screenshot_20180605-130815 Screenshot_20180605-131727

如果不想等的話,也可以直接點畫面,他就會拍照進行辨識;而如果偵測不到可以辨識的東西的話,他則會出現對應的訊息(上方中間的畫面)。

而點選畫面中的圈圈的話,他則就會顯示對應位置辨識出的內容;像是上方右圖,他就有識別出這是「機動戰士鋼彈」(但是 Heresy 直接拍模型都辨識不出來… = =)。

接下來,當然就是到處亂拍試試看了! XD

首先,如果畫面中有文字的話,他會偵測出文字的區域,並在上面以亮白色(算是吧?)來凸顯;在點選之後,就可以進行文字的選取,下面就會顯示對應的文字內容。

Screenshot_20180605-131322 Screenshot_20180605-131925 Screenshot_20180605-131912

有需要的話,也可以點選下方顯示的文字,來進行搜尋;此外,也可以直接點選翻譯,他就會跳到 Google 翻譯了。

另外,上面右圖則可以看到,如果有 QRCode 之類的東西,他也會去解析內容,並顯示網址;然後也可以快速地進入網站。

Screenshot_20180605-210806而在 Heresy 來看,這部分他最方便的,是如果他偵測到的文字裡面有地址、電話、電子郵件的話,他也都會去解析,並顯示在下方,讓使用者可以快速地使用。

像是右圖,就是拍 Taco House 的集點卡的結果,可以看到,下方有顯示他的店家資訊,最下面也有連結到 Google Map 的地址,以及點下去可以快速撥號的電話號碼。

所以,如果是收到別人的名片,想要快速地寄信、或打電話的話,或許用這個方法會滿方便的~

至於在產品偵測的部分呢?老實說,由於各式各樣的產品,有不少都很像,所以 Heresy 也很好奇他到底成功率有多高?

在簡單玩了一下之後,恩…老實說,個人覺得不算好;但是,有的東西辨識的出來,讓 Heresy 還滿訝異的!

像是下面左圖是 Heresy 的 Pebble Time,本來 Heresy 以為考量到錶面客製化的因素,應該認不出來?結果沒想到居然可以正確的認出來!而下方中圖則是 HTC Vive,在特定的角度,他也是認得出來的~

 Screenshot_20180605-185355 Screenshot_20180605-130800 Screenshot_20180605-130733

不過,上方右圖的 Logitech M720 Triathlon 這隻滑鼠,他就只認出羅技的字樣,沒辦法認出型號了。

至於其他東西呢…恩,好像沒這麼好認了。 XD

像下面的可口可樂由於商標明確,算是有認出來;但是曼秀雷敦軟膏,他就只能靠商標便是,沒辦法明確辨識出產品。而下方右圖的軟膏,他則是只能告知是「外用藥物」。

Screenshot_20180605-130617 Screenshot_20180605-185914 Screenshot_20180605-185848 

其他,有的食品的包裝他也有識別成功過,但是大多是向下方左圖一樣,只能辨識出上面的文字。而萬代的鋼彈模型一概無法識別,就連外盒也都一樣只能識別部分文字…

Screenshot_20180605-131128 Screenshot_20180605-130947 Screenshot_20180605-212148

比較有趣的,是 Heresy 之前買的傑米·海納曼的說話人偶,辨識後他是去找類似的眼鏡… o_O

再來,書籍的部分,基本上應該是資料有蒐集到、就可以找到。

像是下面左邊就是《OpenGL Super Bible》這本書,他不但有找到正確的書,也有列出作者的名字;而中間則是《果然我的青春戀愛喜劇搞錯了。》這部輕小說,他除了辨識到標題外,也應該是有靠封面辨識出他是哪一集,不過顯示的是日版的就是了。 ^^"

Screenshot_20180605-130855 Screenshot_20180605-185748 Screenshot_20180605-132014

另外,像是有的網路上的圖片,也是可以辨識的~像是上方右圖的《刀劍神域》的圖片就有辨識出來,下面也可以看到,他也有認出是誰。(但是試了幾張有紀的照片,結果他都認不出來… orz)

再來,地標的部分,雖然沒有跑出去,不過 Heresy 還是靠翻拍照片的方法,來玩了一下。感覺上,比較有名、有特色的地點,似乎是都能辨識得出來的!

 Screenshot_20180605-203809 Screenshot_20180605-213703 Screenshot_20180605-214044

Screenshot_20180605-214403其中,讓 Heresy 比較訝異的是,在 Heresy 來看關西東安古橋的特色應該不算明顯,但是他還是能認出來呢~

當然,辨識率不可能是 100% 的。除了辨識正確、無法辨識外,無可避免地也會有辨識錯誤的狀況。

像是右圖就是他錯把新竹東門城當作影像博物館的狀況。老實說,為什麼會這樣錯,Heresy 實在不太理解就是了…

最後,在動植物的方面,他也是可以辨識的~但是正確性…由於和取景、當下的個體狀態都有很大的關係,所以正確性應該就更低一點了。

下面算是 Heresy 自己測試的幾個例子,至少下面右圖的他建議的三個結果應該都是不對的…

Screenshot_20180605-213447 Screenshot_20180605-213432 Screenshot_20180605-213523


整體來說,個人覺得 Google Lens 算是相當有趣了!雖然不算完美,在某些狀況下,應該也算是實用了。

不過,個人覺得比較可惜的,是他還是需要連接網路才能用,而且也不能分析現有的圖片(這部分應該是要等 Google 相簿開放?)(但是可以傳到電腦,然後翻拍 XD),對於沒有網路吃到飽的人來說,可能算是比較麻煩了。

總之,有興趣的人應該是可以看看能不能用,裝來玩看看了~


另外,個人覺得應該更為實用的 Google Assistant 看來今年應該有機會在台灣開放使用(參考:《AI 語音讓人驚豔的 Google Assistant 今年可能支援中文,台灣使用者將可使用》),就不知道微軟的 Cortana 到底要等到民國幾百年了…

發表留言

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料