突然想到的小招式
八月 27th, 2008剛剛在 Twitter 上面看到 tenz 提到的 Ubiquity,
這才想到,Opera 的網址列搜尋功能似乎可以貼 tweet,
於是我就嘗試了一下。
首先,登入 Twitter。
接著在輸入欄點選右鍵,「建立搜尋」。
然後,設定快速鍵後按下確定。
試試看能不能 post tweet。
看來這招似乎是有用啊。
稍稍看了一下 Ubiquity,它能做的事情似乎更多,
但我在想,或許可以用 userscript 來達成某些功能,
不過這就已經不在我的業務範圍了 (飄)
受保護的文章:心情很差
八月 26th, 2008歌詞: 絲路
八月 21st, 2008我是在聽郝歌的《紅與黑》專輯時,注意到這首歌的,
到 Youtube 上查了之後,才發現原唱是梁靜茹,
而作詞的五月天阿信、作曲的王力宏,都是我滿喜歡的藝人,
不知道這樣的閃亮亮組合有多少作品呢 :p
來說說梁靜茹吧。
一直以來我都滿喜歡她唱的歌,
對我來說,這些歌具有療傷效果,
在心情不好,沒事做或是事情太多的時候,
或者,單純想聽聽歌時,都很適合,
該說是包裝成功,還是這就是她的本質呢?
聽了原唱梁靜茹的版本之後,再聽聽郝歌唱的,
兩者的情緒與表現方式,實在是非常不同啊 (搖晃)
絲路
詞:五月天阿信/曲:王力宏
如果流浪是你的天賦
那麼你 一定是我最美的追逐
如果愛情是你的游牧
擁有過 是不是該滿足
*
誰帶我踏上 孤獨的絲路
追逐你的腳步
誰帶我離開 孤獨的絲路
感受你的溫度
我將眼淚流成天山上面的湖
讓你疲倦時能夠紮營停駐
羌笛聲 胡旋舞 為你笑 為你哭
愛上你的全部 放棄我的全部
&
愛上了你之後 我開始領悟
陪你走了一段最唯美的國度
愛上了你之後 我從來不哭
誰是誰的幸福 我從來不在乎 (# → &)
誰是誰的旅途 我只要你記住
* → #
星星就是窮人的珍珠
你的笑支撐著我虔誠的最初
狂風沙是我單薄衣服
穿越過亞細亞的迷霧
repeat *
#
雲破日出 你是那道光束
帶著平凡的我 走過奇蹟旅途
repeat *
好喜歡這首歌的歌詞,真的。
不過,歌詞裡描寫的世界,似乎遙不可及啊。
工作之餘的休閒 (?) 活動
八月 20th, 2008這幾天在做 IR Evaluation 的工作,
每天要看上幾百篇文章,著實讓眼睛有些吃不消。
在稍稍擱下工作,休息之餘想到前陣子在 MMDays 看到,
微軟亞洲研究院開發的人立方搜尋器,於是便玩了起來。
基於 IR (資料檢索) 的 SNS (社群網路),
是我想做的題目之一,在看到這項產品出現時,
更確定了其可行性與可能的發展方向。
當然,我很好奇它是怎麼敲出名字的,
於是據我所學,猜測可能的作法:
- 暴力產生字典檔
- 使用 N-gram 模型,令 N = 2 ~ K
- 將常用姓氏後面接的字拿來建 tree
- 使用斷詞器斷出名詞
但使用字典檔不是個明智的作法,
只用 N-gram 可能會有姓名過濾上的問題,
而要建出能夠準確斷出姓名的斷詞器,或許有些困難,
看來看去,比較可能的作法該是使用姓氏 + 高頻字/辭,
建成樹狀結構後,利用 TF (字辭出現的頻率) 去敲出名字;
也就是說,在沒有加上判斷可能是姓名的機制下,
搜尋「台電視」、「張桌子」的時候,應該會傳回結果。
至於連線上的關係,我猜或許是用辭性,也或許是用字典算的。
無聊之餘,便也就查了這兩位先生 (?),
而系統也很給面子地傳回了結果:
原來台電視跟蔣先生有關,
而張桌子的關係圖中,甚至還出現了希特勒呢 (炸)
是說,可能真的有人叫「張桌子」也不一定啊。
之後又試了一些奇怪的字辭,像是「科科科」:
國宅「朱學恆」大大:
想到朱大,不免想到在 BoF 時的「媽媽,那個阿姨是誰」:
迷之音: 哎呀,這個似乎很好用啊 XD
咳咳。
無論如何,背後的技術應該不止這些,
隨便去問十個做 IR 的人,會有十一個跟你說,
要做到這樣的結果,有一定的難度啊啊啊 (搖晃)
因為最近北京舉辦了奧運,所以我也搜尋了「北京奧運」,
在這個時候,人立方的介面便提升了找「人」的效率:
過去就曾出現過圖形化的搜尋引擎,
不過,這樣的搜尋方式能不能吸引使用者,
或許還有待觀察吧 :p
無論如何,這確實是個酷玩意。
是說,這樣的休息活動似乎不大休閒啊 =__=||
後記:
在《隨意搜尋》(Ambient Findability) 書中提到,
六度分離理論把人與人之間的關係以圖學方式解釋,
而早期的研究人員,認為「人」是無法當成文件索引的。
書末亦提到,人們已經開始把文件的概念,
套用在過去不被歸納在「可文件化」的東西上,
這意味著,幾乎所有東西都能具有一定的可尋性。
在搜尋器發展之初,搜尋網頁也曾經是件苦差事,
看看現在便不難猜出,未來搜尋其他類型「文件」的可能了。

















