可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关

来源:学生作业帮助网 编辑:作业帮 时间:2024/05/09 04:34:33
可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关

可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关
可爱的python一道习题,
2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关键词 => 文档序号.其中,原索引文件作为命令行参数传入主程序,并设计一个collect函式统计 "关键字序号" 结果对,最后在主程序中输出结果至屏幕.
cdays-3-test.txt 内容:
1 key1
2 key2
3 key1
7 key3
8 key2
10 key1
14 key2
19 key4
20 key1
30 key3
主要想看的是结果怎么出来的,如果你直接找答案过来粘贴的,就不用了,要真实操作的截图,
我的报错
Traceback (most recent call last):
File "D:\python\ly\src\supercat\���.py",line 26,in
result = collect(open('D:\python\huge.txt','r')) #调用collect函式,返回结果
File "D:\python\ly\src\supercat\���.py",line 15,in collect
left,right = line.split() #将一行以空格分割为左右两部分
ValueError:need more than 0 values to unpack

可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关
原因是你的"cdays-3-test.txt"文件里有空行,可以在"left,right = line.split()"之前先判断并跳过空行;
还有一个方案是用正则表达式进行信息提取解析.