Solr - Enterprise search 的「黑盒子」

>> 2007/07/25

最近因為需要做 search,於是找了 Lucene 來看,順便寫了些簡單的 index、search 的 code 摸摸看感覺。用 Lucene 的理由很多,速度快、scalability 好都是原因之一,很多大站 (digg、livejournal、CNet、Joost) 都採用也是原因,但是最重要的理由則是我對商業環境使用 Open Source 軟體的哲學...

「要用 Open Source 的玩意兒,就要用 community 最大、最 active 的」。因為這樣,白老鼠才夠多,support 才夠廣,支援度也夠好。有地雷的話,會有人先替你踩過,有問題會有人先修好 XD

廢話說完了,該來說 Solr (發音同 Solar)。話說今天下午,寫一些簡單的 code 測試 Lucene,結果在翻 documents 的時候意外翻到 Solr。看了幾下子以後開始幹聲連連... (我怎麼不早點看到這玩意兒啊?) 看來 Solr 根本把所有站內搜尋應該做的事情做完了嘛。

簡單說,Solr 是完全把 Lucene 整個包起來,藏成一個搜尋的黑盒子。你不要管 Lucene 裡面怎麼做 Tokenizer、Analyzer (雖然如果想改也可以),而只需要透過 XML/HTTP 來跟 Solr 溝通即可。要新增文件去搜尋,就用 HTTP POST 塞資料給它。要做搜尋的時候,再另外做 HTTP GET 就好。非常符合 KISS 原則 (Keep It Simple, Stupid)。

雖然還沒進行壓力測試,不過 Solr 的底層是 Lucene,又是 CNet 的人寫出來的,看起來應該是還不錯用才對。

還是那句話,我怎麼摸 Lucene 好幾天以後才看到這種好東西呢...

Read more...

出槌的 YK 首頁...

>> 2007/07/19

嗯,啊... 雖然貼文的時候已經正常了,不過有圖有真相,既然抓了圖就貼一下吧...

index1

點選第一則新聞下去的時候...

index2

Orz

Read more...

Economist Audio Edition

>> 2007/07/17

Economist 出有聲版了。對於視覺障礙的人當然是福音,不過對於忙碌得沒空翻閱、或是想省點目力的人來說,倒也是個大福音。以後只要帶著隨身聽,哪裡都可以聽有聲版的 Economist 了....

訂戶下載有聲版完全免費,如果不是訂戶,下載當期有聲版要 $8 USD,舊版的要 $10 USD。每一期的總長度大約 6 - 7 小時,如果有 special report 的話大約八小時。不過,當然是每篇文章分開一個 mp3 檔,選擇上倒是很方便。

連結在此:Audio Edition

Read more...

拉拉是個人才

>> 2007/07/16

不,我沒有打錯字,「丁丁是人才」已經是老梗了!請看「拉拉是人才」。 XD

Read more...

「大麥克指數」- Big Mac Index

Economist 上禮拜編了一份很好玩的「大麥克指數」。基本上是拿各個國家麥當勞賣的 Big Mac 的售價來作比較,看看各個國家的麥當勞售價,和他們實際換算的該國匯率是否有差別。(是啊,我知道很多人都做過這種「用麥當勞售價來比較物價差異」的簡單調查 :p)

由表中可知,中國大陸 (-58%) 和香港 (-55%)、埃及 (-51%) 都似乎有匯率嚴重低估之嫌。台灣的 (-33%) 似乎也有這樣的影子。

圖表貼在後面:

big_mac_index

Source: Economist - The Big Mac Index

Read more...

Facebook 的 CEO 被告了

>> 2007/07/15

Facebook 的 CEO Mark Zuckerberg 被告了。(詳見 slashdot) 三個原告認為 Facebook 根本是剽竊了他們當年的 Business plan和程式原始碼。三名原告當年的網站後來發展成為現在的 ConnectU。三個原告於是要求法官:

1. 關閉 facebook
2. 將 facebook 的所有權,以及 facebook 所有的利潤,轉移給原告。

很多人聽到消息的直覺反應是:太扯了。

真的是滿扯的,不過大家都忽略了一件事情:在美國,打官司告人是非常容易的事情。他們打官司的目的經常不是為了勝訴,而是為了凹比較好的和解條件。

Facebook 如今是當紅炸子雞,看來大家都想找個藉口分杯羹。

Read more...

今天在路邊看到的有趣車子貼紙...

>> 2007/07/14

這個車屁股的貼紙不錯

讓我想到以前的 "If you can read this YOU ARE TOO CLOSE" XD

Read more...

Transformers 惡搞

禮拜五看到一個很有趣的 Transformers 惡搞頁面,實在很好玩...

這隻憑空被創造出來的 Decepticon:

Skor

還有一跟迴紋針居然可以變成壹台機器人 =_=

Pleasing-Shape

但是下面這種就太扯了... Orz

Starblind

Dextromethod

所有圖片都來自 http://www.somethingawful.com/d/photoshop-phriday/new-transformers-robots.php?page=1
雖然顯然我慢了人家好幾個月 XD

Read more...

「諫逐客書」不應該在國文考題出現嗎?

>> 2007/07/03

很久沒寫 blog 了,今天看到一個新聞,真的教我傻了眼。

今天在這裡這裡都看到,這次大學指定考試,國文考題裡面出現了李斯的不朽名作「諫逐客書」的翻譯題。報導中提到,許多學生認為,「秦始皇時代的老古董文章竟然會出現,教人看傻眼。」看到我一整個 orz。

國文考試出現「諫逐客書」很奇怪嗎?記得以前唸書的時候,這篇文章剛好也是國文課文的一篇。學校指定要唸的古文觀止裡面也有節錄。這篇文章本來就是熱門考題的來源,自己沒準備過的話只能說是自己不用功吧?

更何況這篇「諫逐客書」在中國文學上面的地位自古以來就不可磨滅。歷代文選只要有節錄先秦文學的一定會將這篇文章選入其中。李斯的文章本來就華美無比,這篇諫逐客書更是發揮的淋漓盡致。整篇文章看下來,不管是從理性出發的是非對錯,或是感性上的情感訴求,甚至是形勢而言的利害關係,李斯的「諫逐客書」都納入其中,成為中國文學論說文的千古典範。整篇文章讀下來,完全不難理解當年贏政為什麼會被說動,也完全可以了解為什麼贏政會對李斯另眼相看委以重任。

這麼重要的一篇文章,出現在考題有什麼奇怪的呢?又跟作者是兩千年前的人物有什麼關係?

高中的時候第一次看這篇文章。當時雖然書唸的不多,但是唸過以後總是忍不住反覆誦讀,再三回味。今天看到新聞以後重新讀了一遍,雋永依然,瑰麗不減。遺憾的是,難道以後受教育的小孩子,都不用讀經典文學,都體會不到古人的文化和文學素養了嗎?

Read more...

最新文章

最新回應

部落格貼紙

  © Free Blogger Templates Autumn Leaves by Ourblogtemplates.com 2008

Back to TOP