這就是莫名熟悉的感覺啊

八月 28th, 2008
funP Sticker

剛剛看到 River 的新漫畫《開箱文》,我笑了 XD

其實這篇是所謂的兩行文 (炸)

突然想到的小招式

八月 27th, 2008
funP Sticker

剛剛在 Twitter 上面看到 tenz 提到的 Ubiquity
這才想到,Opera 的網址列搜尋功能似乎可以貼 tweet,
於是我就嘗試了一下。

首先,登入 Twitter。

20080827_opera-twitter01

接著在輸入欄點選右鍵,「建立搜尋」。

20080827_opera-twitter02

然後,設定快速鍵後按下確定。

20080827_opera-twitter03

試試看能不能 post tweet。

20080827_opera-twitter04

看來這招似乎是有用啊。

20080827_opera-twitter05

稍稍看了一下 Ubiquity,它能做的事情似乎更多,
但我在想,或許可以用 userscript 來達成某些功能,
不過這就已經不在我的業務範圍了 (飄)

受保護的文章:心情很差

八月 26th, 2008
funP Sticker

本文受密碼保護,須填寫您的密碼才能閱讀。


歌詞: 絲路

八月 21st, 2008
funP Sticker

我是在聽郝歌的《紅與黑》專輯時,注意到這首歌的,
到 Youtube 上查了之後,才發現原唱是梁靜茹,
而作詞的五月天阿信、作曲的王力宏,都是我滿喜歡的藝人,
不知道這樣的閃亮亮組合有多少作品呢 :p

來說說梁靜茹吧。

一直以來我都滿喜歡她唱的歌,
對我來說,這些歌具有療傷效果,
在心情不好,沒事做或是事情太多的時候,
或者,單純想聽聽歌時,都很適合,
該說是包裝成功,還是這就是她的本質呢?

聽了原唱梁靜茹的版本之後,再聽聽郝歌唱的,
兩者的情緒與表現方式,實在是非常不同啊 (搖晃)


Object: YouTube Video, [link][mobile link]

絲路
詞:五月天阿信/曲:王力宏

如果流浪是你的天賦
那麼你 一定是我最美的追逐
如果愛情是你的游牧
擁有過 是不是該滿足

*
誰帶我踏上 孤獨的絲路
追逐你的腳步
誰帶我離開 孤獨的絲路
感受你的溫度

我將眼淚流成天山上面的湖
讓你疲倦時能夠紮營停駐
羌笛聲 胡旋舞 為你笑 為你哭
愛上你的全部 放棄我的全部

&
愛上了你之後 我開始領悟
陪你走了一段最唯美的國度
愛上了你之後 我從來不哭
誰是誰的幸福 我從來不在乎 (# → &)
誰是誰的旅途 我只要你記住
* → #

星星就是窮人的珍珠
你的笑支撐著我虔誠的最初
狂風沙是我單薄衣服
穿越過亞細亞的迷霧
repeat *

#
雲破日出 你是那道光束
帶著平凡的我 走過奇蹟旅途
repeat *


好喜歡這首歌的歌詞,真的。

不過,歌詞裡描寫的世界,似乎遙不可及啊。

工作之餘的休閒 (?) 活動

八月 20th, 2008
funP Sticker

這幾天在做 IR Evaluation 的工作,
每天要看上幾百篇文章,著實讓眼睛有些吃不消。

在稍稍擱下工作,休息之餘想到前陣子在 MMDays 看到,
微軟亞洲研究院開發的人立方搜尋器,於是便玩了起來。

基於 IR (資料檢索) 的 SNS (社群網路),
是我想做的題目之一,在看到這項產品出現時,
更確定了其可行性與可能的發展方向。

當然,我很好奇它是怎麼敲出名字的,
於是據我所學,猜測可能的作法:

  1. 暴力產生字典檔
  2. 使用 N-gram 模型,令 N = 2 ~ K
  3. 將常用姓氏後面接的字拿來建 tree
  4. 使用斷詞器斷出名詞

但使用字典檔不是個明智的作法,
只用 N-gram 可能會有姓名過濾上的問題,
而要建出能夠準確斷出姓名的斷詞器,或許有些困難,
看來看去,比較可能的作法該是使用姓氏 + 高頻字/辭,
建成樹狀結構後,利用 TF (字辭出現的頻率) 去敲出名字;
也就是說,在沒有加上判斷可能是姓名的機制下,
搜尋「台電視」、「張桌子」的時候,應該會傳回結果。

至於連線上的關係,我猜或許是用辭性,也或許是用字典算的。

無聊之餘,便也就查了這兩位先生 (?),
而系統也很給面子地傳回了結果:

20080817_RLF01

20080817_RLF02

原來台電視跟蔣先生有關,
而張桌子的關係圖中,甚至還出現了希特勒呢 (炸)

是說,可能真的有人叫「張桌子」也不一定啊。

之後又試了一些奇怪的字辭,像是「科科科」:

20080817_RLF03

國宅「朱學恆」大大:

20080817_RLF04

想到朱大,不免想到在 BoF 時的「媽媽,那個阿姨是誰」:

20080817_RLF05

迷之音: 哎呀,這個似乎很好用啊 XD

咳咳。

無論如何,背後的技術應該不止這些,
隨便去問十個做 IR 的人,會有十一個跟你說,
要做到這樣的結果,有一定的難度啊啊啊 (搖晃)

因為最近北京舉辦了奧運,所以我也搜尋了「北京奧運」,
在這個時候,人立方的介面便提升了找「人」的效率:

20080817_RLF06

過去就曾出現過圖形化的搜尋引擎,
不過,這樣的搜尋方式能不能吸引使用者,
或許還有待觀察吧 :p

無論如何,這確實是個酷玩意。

是說,這樣的休息活動似乎不大休閒啊 =__=||


後記:
在《隨意搜尋》(Ambient Findability) 書中提到,
六度分離理論把人與人之間的關係以圖學方式解釋,
而早期的研究人員,認為「人」是無法當成文件索引的。

書末亦提到,人們已經開始把文件的概念,
套用在過去不被歸納在「可文件化」的東西上,
這意味著,幾乎所有東西都能具有一定的可尋性。

在搜尋器發展之初,搜尋網頁也曾經是件苦差事,
看看現在便不難猜出,未來搜尋其他類型「文件」的可能了。