第三千零七十二章 将优势发挥出来
第三千零七十二章 将优势发挥出来 (第2/2页)“嗯,的确好用,直到现在我还在用。”辜老点头:“节省了好些查阅资料的功夫,听说还搞出了一些‘名人行状’之类的东西?”
“对,这个分支的大作用是在学术上,供大家进行数据检索用,同时还可以让程序学会我们检索数据的思路,让它去检索海量的典籍,最后将我们想要的一系列知识点寻找出来,建立起逻辑关系,最后形成一部检索成果。”
“我同学张辛夷就在做《苏东坡轶事汇编》的三苏轶事的检索程序脚本分析研究,作为自己的毕业论文课题。”
“等做出来后寄给我看看。”辜老对这个当然很感兴趣:“你中学同学吧?时间真快,这都要本科毕业了。要考研吗?”
“要,好像还挺有信心的。”肘子笑道:“不过我们先不说它,现在还有一个通用类的引擎,是我们与四叶草浏览器相配套的,方便大家在网上查询信息的网络黄页标签类搜索引擎。”
“举这两个例子其实就是想说,这类文法逻辑分析类的工具其实已经存在了,只要小智掌握了这类工具的使用方法,理论上是可以根据逻辑关系解读并检索出有效信息的。”
“比如苏东坡行状,我们可以先给苏轼打上一堆的标签如苏轼,子瞻,和仲,铁冠道人、东坡居士眉山苏家,三苏,嘉佑龙虎榜进士,制科三等,大理评事签书凤翔府判官,杭州、密州、徐州、湖州知州,乌台诗案,黄州团练副使,旧党,文豪,豪放派词人,苏黄,苏辛,欧苏,唐宋八大家,宋四家,宋六家,《东坡七集》,《东坡易传》,《东坡乐府》,《寒食帖》,《潇湘竹石图》,《枯木怪石图》等等标签,利用这些标签检索数据库,得到合用的信息,再从这些信息里提取出更多更复杂的标签,最后完成苏轼的行状画像,将曾经在历史典籍,古人笔记,朝代公文章奏当中出现过的苏轼事迹全部撷取出来,形成一个完整的《东坡行状》来。”
“这套方法我们是成功了的,现在的做法,就有点类似于让给小智掌握这套方法,我们只需要给他下达一个‘请搜集欧阳修行状’的指令,他就可以用我们搞出《东坡行状》的方法,去搞出《六一居士行状》来,进而也可以使用于其余的历史人物。”
“至于说声韵检索,虽然相比名人行状检索要复杂一些,还涉及到从方言标本库中选取样本进行拼合和验证的工作,但是底层的研究逻辑规律,对海量数据利用大数据统计分析方法进行检索比对,最后找到最优解,这套思路其实是相似的。”
“声韵在文字上的体现是相当多的,包括了前朝留下来的诗词,骈文,古人笔记里记录的俗谚,歌词,曲词,更重要的,还有历朝官方颁布的声韵文献,以及历朝学者们对声韵的研究成果。”
“将这些东西都尽量搜掘出来,分时代进行规律总结,再从方言样本中选取出最优解,将之确定为最接近当时的读音,最后整合出一套中古声韵拟构表来,我觉得从思路上来说,是没有毛病的。”
“主要是要将现代信息技术的优势发挥出来。”