写个 shell 脚本格式化输出数据,出现诡异 bug,郁闷了一天,早上看书之际,dos2unix 出现到脑海中,乌云散去,果然如此。

情景

有一个 txt 文件,行数很多,需要复制其中的部分数据到 excel 统计,一个文件大概要复制 40-50 次,懒人总是想捷径。首先想到的是使用 shell 脚本实现,因为 python 才开始,先是看书,4-5天,写脚本,各种碰壁,于是 用了低级方法可以干活,隔几天后 改进,如下。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
#!/bin/bash

tempfile=`mktemp const.XXXXXXXX`

sed -n '/+\/-/p' $1 > $tempfile
bulkmodulus=`gawk '/=/ { print $4 }' $tempfile`


for (( j = 4; j < 7; j = j + 2 ))
do
	for (( i = 1; i < 22; i++ ))
	do 
		cijTempName=`cat $tempfile | gawk -v circle=$j '$1 == loop {print $circle}' loop=$i`
	
		if [ $i -ge 2 ] && [ $i -le 6 ]
		then
			if [ -z $cijTempName ]
			then
				echo -e "-\t\c"
			else
				echo -e $cijTempName"\t\c"
			fi
		else
			if [ -z $cijTempName ]
			then
				echo -e "0\t\c"
			else
				echo -e $cijTempName"\t\c"
			fi
		fi
	done
	echo 
done

echo 

echo 'bulk:' $bulkmodulus 

rm -f $tempfile $tempfile2

数据大概如下:

use-linux-format-not-dos-1.jpg

做了部分模糊处理。

错误

需要提出 cij 的 第 4列 以及 第 6 列。使用制表符在各自行中打印。

use-linux-format-not-dos-2.jpg

结果出乎我的意料,第二行的 误差值 只打印了两个。

百思不得其解,我甚至已经考虑 使用 awk 的 FS ORS 各种折腾。最后皆以失败告终。

解决

今天图书馆看书,突然想到我这个 txt 文件是在 windows 生成的,自然 换行符与 linux/unix 的不同,如此以来自然能够解释 中间部分正常,而尾巴部分出现诡异。

于是,加上 dos2unix Constants.txt ,完美解决问题。

use-linux-format-not-dos-3.jpg

存在即是合理,不是莫名其妙,只是你不知道。