有趣的 HTML5 網站文字雲


這是 Heresy 在一個朋友的 Google+ 看到的東西。在介紹前,先來看透過他分析 Heresy 這個部落格產生的結果吧~

雖然都是由文字構成的,但是感覺滿有趣的吧?基本上,這個「HTML5 文字雲 文章詞彙分析機」所做的事,就是把網站、文字檔、RSS Feed 的內容拿來做分析,用比較大的字體、來顯示比較常出現的文字,然後再把比較少用到的詞彙,用比較小的字體,塞在目前還是空白的地方,構成一張類似上面的圖~如果想看更詳細的說明的,則可以參考官方的介紹(還包含了一些在幾種瀏覽器上的技術狀況)。

而分析 Heresy 的部落格(透過 RSS Feed)後,就是上圖的結果了!理所當然的,「Heresy」這個詞出現的次數是最多的(畢竟和 Heresy 習慣性地自稱有關係啊)~其次呢,就像該篇介紹所說的,「可以」是最多的;但是接下來呢,看來似乎也都是「不過」、「就是」、「應該」、「所以」這類的詞了…

本來 Heresy 還以為會有一些技術名詞比較大的,但是看來是… orz
看完之後的想法是:或許該考慮一下,要不要修改一下自己的用語習慣了吧~ XD

也想知道自己的網站/部落格的用詞習慣嗎?趕快到HTML5 文字雲 文章詞彙分析機玩看看吧!

最後,目前這東西已經是 OpenSource 的了~也可以到 Github 上去拿到程式碼(詳見《Word Cloud – Open source "Wordle" in HTML5》),有興趣研究的話,應該可以自己抓原始碼來玩看看了。


另外,下面則是透過他的工具、把文字縮小一點的版本。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.