python的dataframe(py.read_table)读取txt,但是间隔为大于两个且个数不定的空格,如何操作?

如图所示,数据有中英文和数字,按照任意空白delim_whitespace=True,或者sep='\\s+'是行不通的。这个数据是用dataframe直接输出到txt中的,但经过尝试,间隔不是默认的'\t'。可有办法解决?

先见数据转为python数据格式,

像Harvard University很难分割的可以用re正则表达式\s{2,5}

尝试对齐操作

{:^20d} = 中间对齐 (宽度为20)

{:<20d} = 左对齐 (宽度为20)

{:>20d}或{:20d} = 右对齐 (默认, 宽度为20)

不过这个对中文会不友好

所有也要使用中文空格进行对齐

你那个学校要用全角符号的空格进行对

ps:在分号(:)和(^<>)中加一个字符代表对齐方式


温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-07-03
py.read_table是什么,pandas有这个方法吗
相似回答