這是 Heresy 在一個朋友的 Google+ 看到的東西。在介紹前,先來看透過他分析 Heresy 這個部落格產生的結果吧~
雖然都是由文字構成的,但是感覺滿有趣的吧?基本上,這個「HTML5 文字雲 文章詞彙分析機」所做的事,就是把網站、文字檔、RSS Feed 的內容拿來做分析,用比較大的字體、來顯示比較常出現的文字,然後再把比較少用到的詞彙,用比較小的字體,塞在目前還是空白的地方,構成一張類似上面的圖~如果想看更詳細的說明的,則可以參考官方的介紹(還包含了一些在幾種瀏覽器上的技術狀況)。
而分析 Heresy 的部落格(透過 RSS Feed)後,就是上圖的結果了!理所當然的,「Heresy」這個詞出現的次數是最多的(畢竟和 Heresy 習慣性地自稱有關係啊)~其次呢,就像該篇介紹所說的,「可以」是最多的;但是接下來呢,看來似乎也都是「不過」、「就是」、「應該」、「所以」這類的詞了…
本來 Heresy 還以為會有一些技術名詞比較大的,但是看來是… orz
看完之後的想法是:或許該考慮一下,要不要修改一下自己的用語習慣了吧~ XD
也想知道自己的網站/部落格的用詞習慣嗎?趕快到HTML5 文字雲 文章詞彙分析機玩看看吧!
最後,目前這東西已經是 OpenSource 的了~也可以到 Github 上去拿到程式碼(詳見《Word Cloud – Open source "Wordle" in HTML5》),有興趣研究的話,應該可以自己抓原始碼來玩看看了。
另外,下面則是透過他的工具、把文字縮小一點的版本。