如图所示,数据有中英文和数字,按照任意空白delim_whitespace=True,或者sep='\\s+'是行不通的。这个数据是用dataframe直接输出到txt中的,但经过尝试,间隔不是默认的'\t'。可有办法解决?
先见数据转为python数据格式,
像Harvard University很难分割的可以用re正则表达式\s{2,5}
尝试对齐操作
{:^20d} = 中间对齐 (宽度为20)
{:<20d} = 左对齐 (宽度为20)
{:>20d}或{:20d} = 右对齐 (默认, 宽度为20)
不过这个对中文会不友好
所有也要使用中文空格进行对齐
你那个学校要用全角符号的空格进行对
ps:在分号(:)和(^<>)中加一个字符代表对齐方式