分享| Share!

22:38:27 / 2013年04月14日

#算法#為歷史文獻斷代
如何保存財產和土地交易的記錄,從而完善地建立起所有權制度并解決糾紛,這對任何社會來說都是至關重要的。在中世紀的英國,這一過程在很大程度上是由宗教和皇家機構實施的,他們用拉丁語文獻的形式保存這些記錄,名曰“契據”。

今天,大約有100多萬份契據被保存下來,有的是原始文獻,更多的是原件的古代復制品。它們為今天人們了解10世紀至14世紀間英國的政治、經濟和社會狀況提供了非常好的依據。比如,歷史學家可以利用這些文獻來研究軍事和宗教組織的興衰。對耶路撒冷圣約翰醫院勛章的研究就是一個很典型的例子,耶路撒冷圣約翰醫院是在11世紀西方對耶路撒冷的征服(即第一次十字軍東征)之后建立的宗教和軍事組織。

歷史學家表示,這份契據清楚地顯示該組織是如何為響應1145年的第二次十字軍東征的號召而逐步軍事化的。這次軍事行動的起因是穆斯林軍隊占領了當地的多座城鎮。

顯然,這些文獻有巨大的歷史價值,但存在一個問題:大多數契據都沒有標明年代,在1066年至1307年的諾曼人統治時期尤其如此。

留給歷史學家的問題是要找到方法按時間順序排列這些文獻。但這是個很困難的任務。

現在,多倫多大學教授杰里拉-提拉汗(Gelila Tilahun)和他的同事們探討了這一難題,大致提出了他們用來解決這個問題的新的計算機統計技術。

他們的方法是,使用10000份署有年代的一部分契據,考察所使用的語言隨時間的變化情況,以此來確定其他契據的年代。比如,他們表示“amicorum meorum vivorum et mortuorum”這個短語(意為:我活著的或死去的朋友)在1150年至1240年間很常見,在其他年代不常見。而“Francis et Anglicis”這一稱呼(意為“到法國和英格蘭”)在1204年英格蘭將諾曼底割給法國后就逐步消失了。

不過,這個統計方法要比僅僅考察常用短語嚴密得多。提拉汗和同事們使用計算機對出現一次、兩次、三次等單詞的分布方式進行搜索。他們表示:“我們的目標是開發出一套算法,通過純計算的方法讓對年代缺失的契據進行斷代的過程實現自動化?!?br/>這一方法在他們試圖對單個文獻進行斷代的測試過程中展現出多種模式。他們表示,最好的方式是用最流行的技術:這一統計技術通過將文獻中的單詞集與訓練集中的分布情況進行比較,得到可能性最大的年代結果。

提拉汗和同事們表示,他們的方法也有其他用途。比如,同樣的技術可以用來推斷文獻的作者是誰,也可以排除贗品,而贗品的數量可能是巨大的。

那么這種方法實際用起來如何?提拉汗和同事們在論文的結尾給出了一則關于一份中世紀英格蘭的契據的趣聞。這份契據是在尼亞加拉大瀑布附近的布魯克大學圖書館的一個抽屜中發現的,上面沒有署年代,許多歷史學家都試圖推斷出它是何時所寫。開始的推測是在14世紀,但不久又改為13世紀。最終,一位學者通過和其他記錄的比較,確定這份契據作于1235年至1245年間。

提拉汗和同事們受到媒體對這份契據關注的啟發,對其使用他們的自動化方法進行了估計。他們帶著點兒得意地表示:“我們獲得的估計數據顯示是1246年?!辈毁?!

原文鏈接:
http://www.technologyreview.com/view/509876/the-algorithms-that-automatically-date-medieval-manuscripts/
?

支持

ad ad ad ad

能為您做什么?

我們專注于 軟件開發,硬件集成,算法設計,逆向破解。全面為您提供策劃,架構,實施,測試,外包的貼心服務。

更多

我們的特點

自主JAVA框架、以及SGUI帶給您的項目更個性、更實用的用戶體驗。擁有各語言、平臺相關的開發經驗、技術文檔積淀,讓項目可維護性更高,更安全。

TAGS:成都軟件破解,成都APP破解,逆向破解,SGUI,GUI,外掛技術研究,程序破解,成都軟件開發,軟件開發,成都軟件外包,成都軟件定制,成都軟件公司,硬件集成,SUODR,C++,C,匯編,CPU指令,算法設計,C#,PHP,JAVASCRIPT,ACTIONSCRIPT,外包服務。


聯系方式

電話: (+86)028-86612252
               /15198199629
地址:成都市高新區益州大道中段722號復城國際T2棟1409號
EMAIL: yiqisun#suodr.com(#換成@)

QQ在線服務