优质中文网

手机浏览器扫描二维码访问

201 秦雨诺 他把我当问答模型了(第2页)

只是交流五次就回答出这个问题,周岩还是比较意外的。

于是他改变了思路,选择提出一个大项目,让01首先提供完成这个大项目需要的步骤。

而很快,01就给出了步骤,一共五点。

周岩给出的要求是:对网络文本进行文本统计分析。

01的回复是:1、导入文本。2、文本预处理。3、文本统计。4、得出结论。

比较简单,周岩给出具体一点的要求。

于是01的回复变成了:1、导入小说文本。2、对小说文本进行预处理,导入停用词表,使用分词工具对文本进行预处理。3、对处理后的分词文本,进行词频统计。4、对词频统计后的结果进行词频统计分析,得出结论。

具体了一些,只不过依旧有点儿宽泛。

不过周岩等不及了,

他直接提出让01根据自己的步骤,生成相关的代码。

而很快,01就生成了一系列的代码。

周岩下载了《斗破苍穹》的小说文本,对这段代码进行验证,很快就得到了不错的数据,虽然不全面,但显然这个项目是能进行下去的。

周岩又对这段代码提出改进要求,包括词频可视化,把词频用云图展现出来,包括对词频进行文本训练,从而找出词与词之间的关联。

这一回周岩提出的要求是对两本文本进行处理,两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》。

很快01给出了相应的代码修改,周岩复制粘贴之后,进行测试。

其实需求也特别简单,就是找主角之间的人物关系。

杨过对应小龙女,那么郭靖对应什么,结果:黄蓉。

周岩又找了杨过和郭靖分别对应的关联词,同时让01局限在人物身上,自己设计一个人物词判定代码。

这一回01终于出现了一点错误,比如人物切分上面,会把4个词的人物变成2个词输出。

这就是细节上的毛病了,周岩现在也不是算法小白,知道怎么改进,不过周岩更期待01给出的结果。

于是他把这个问题粘贴给了01,而01也给出了对词频进行判定,如果两个拆分的词同时出现多次,那么判定两个拆分的词合并成为同一个词,并在字典中删除前面两个拆分词,并对已经分词好的数据进行处理,合并两个拆分词,没有分词好的就以该拆分词作为分词依据,照着分词就行。

粘贴进去以后,周岩发现效果意外的不错。

只是之后人物判别上也出现了一些问题,会把武器什么的加进去。

周岩又去问01,01回答了一些代码修改,但加进去以后,依旧是老样子,没法做到细致的划分。

周岩问01有没有什么好的办法,01说在处理之前,就把处理的小说人物给预设出来,这样就不会出现之后判定错误的情况。

也就是从源头解决问题,同样也算是一件很机械的处理方式。

但是人类有时候的处理,同样很机械,而且也是填鸭式的,就比如基因测序。

所以对于这一点也没办法太过要求什么,01做到这个程度,其实已经挺不错了。

周岩又预设了几个小型项目,并对01进行测试。

终于周岩也得出了一个结论。

那就是01已经具备了较复杂的代码作业能力。

我的选项成真了!  生存作业  金光之荻花题叶  天下无仙:极夜  盖世皇太子唐羽萧玉淑  不过是这样的故事  死后的我被神明捡到只好为祂打工  陆清清盛明羲  疯了!顶流死对头来我婚礼抢亲了  沈竹江白歌  林北天秦晓柔全文阅读  海贼:百兽团的最强生物  天界往事  冰山女战神的护身狂医  洛杉矶神探  分手当天,我闪婚了亿万富豪陆清清盛明羲  分手后,我走上了人生巅峰陆清清盛明羲  战神奶爸  盖世皇太子  特种兵:开局被龙小云拉去领证  

热门小说推荐
太古神王

太古神王

玄幻爽文九天大陆,天穹之上有九条星河,亿万星辰,皆为武命星辰,武道之人,可沟通星辰,觉醒星魂,成武命修士。传说,九天大陆最为厉害的武修,每突破一个境界,便能开辟一扇星门,从而沟通一颗星辰,直至,让九重天上,都有自己的武命星辰,化身通天彻地的太古神王。亿万生灵诸天万界,秦问天笑看苍天,他要做天空,最亮的那颗星辰...

神圣罗马帝国

神圣罗马帝国

一部奥地利的复兴之路,一部哈布斯堡家族的奋斗史!!!既不神圣,也不罗马,更不帝国的神圣罗马帝国复兴了!!!已完本老书地中海霸主之路,新书逐道在诸天,欢迎大家加入。欢迎加入新海月1书友群,群聊号码688510445(本故事纯属虚构,揭露帝国主义黑历史)...

魏武侯

魏武侯

这里不是春秋战国,也不是东汉末年!似曾相识的齐楚秦魏,截然不同的列国争雄!来自现代的灵魂,入主王侯之家,却命悬一线君王之路,前狼后虎,他将何去何从!大争之世,群雄并起,谁能主宰沉浮!魏无忌寡人这辈子只信刀剑说话,管你诸侯还是天子,不服的有种就站出来。本书群号327625454PS本书...

每日热搜小说推荐