OUaT 小說搜尋器?

既然有 OUaT 關鍵字產生器,可以產生一組關鍵字拿來寫小說,忍不住在想是否也可以反過來產生關鍵字然後用來搜尋小說?

要達成這個目標,最直觀的想法,是首先要先收集很多小說,建成資料庫。然後拿跳出來的關鍵字資料庫裡面搜尋。

當然在現在有 google 自訂搜尋的情況下,我其實不需要建立整個小說內文的資料庫,只需要有這些小說的網址就夠了。雖然 google 自訂搜尋的搜尋框應該是不會允許我讓網頁自動填入(抽出來的)關鍵字。(允許自動填入的話不成了洗搜尋大漏洞?)不過至少我可以很簡單地和現在的網頁版關鍵字產生器結合,把搜尋框和關鍵字結果放在同一個網頁,讓使用者自己選擇關鍵字填入搜尋。

所以只要解決小說們的網址就好了,應該不會太過困難吧?

才怪。

想試就試,我在 google 自訂搜尋裡做了這個 OUaT 搜尋。首先先簡單放進我的 OUaT 故事和 En 的 OUaT 故事吧。放進我的故事簡單,只要請 google 搜尋包含 http://urochordate.com/writing/short/once_upon_a_time/ OUaT 資料夾裡面的全部文章即可。但是 En 的痞客幫部落格就沒那麼友善了。

En 的 OUaT 故事分類頁在 http://encty.pixnet.net/blog/category/1400735,但是裡面的那些 OUaT 故事位址並不是在這個資料夾裡面,而是和 En 其他的所有部落格文章,包括他的其他小說、閱讀心得、電影心得、啦哩拉雜的各種抱怨一起,統統放在 http://encty.pixnet.net/blog/post/ 下,也就是分類是分表面上的,它們並沒有被歸類分好。所以要建立這個搜尋,我得一頁一頁地把 OUaT 故事網址弄進 google 自訂搜尋網址清單裡面。(而且沒記錯的話,像是 yam 天空也是同樣的網址模式。blogspot 則似乎是基於日期,也就是最原始的部落格文章分類方式來收納文章網址。)

當然 google 自訂搜尋除了加入資料夾(加入位址包含此 URL 的所有網頁 )或單一網頁之外,它也允許所謂網址模式比如 ooo.xxx.com/page.php?novel=*(星號後面隨便什麼字統統包進去),或者動態擷取某一頁上的連結。理論上這樣可以直接填 En 的 OUaT 分類頁,就包含了所有在裡面的連結,但這一頁同時也有部落格公用側欄內含好多不太相關的網頁(呃)。

當然如果這種參雜情形不太嚴重的話,或許這是比較容易的解決方式,畢竟我今天光是把 en 的 25 天半故事一頁頁放進去就弄得好煩。(然而只有我們兩個 OUaT 故事加總的搜尋,說實在至少在目前還沒什麼使用搜尋的價值。)然而 google 也很奸詐是免費的自訂搜尋帳號似乎只允許 200 頁爬到的結果……

這陣子會偷點空試一下,看怎麼樣可以在減少雜頁數量的情況下增加可搜尋的小說網頁。先從我們兩隻這邊開始,接下來如果真的試出什麼好一點的方法,再來問問看認識的作者朋友們有沒有興趣被放進來囉。如果能有夠多的小說網頁,那麼再來把這個自訂搜尋框放進 OUaT 關鍵字搜尋網頁裡頭試試。

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料