shell中处理json数据工具jq
在维护系统中,经常会遇到需要处理一些程序的json格式配置文件,并且在curl脚本处理RESTful返回数据。
如果输出内容没有很好格式化,则大量的json字符串非常不利于检查。此时,使用python模块 json.tool 过滤就可以输出标准格式json内容:
container_id=f4810fec374a096895c90e1c74574a7d69e5ec306ea8fe0817e461c28b3da716
cat /var/run/docker/libcontainerd/${container_id}/config.json | python -m json.tool输出内容是非常清晰的json格式:
{
    "annotations": {
        "__BlkBufferWriteBps": "0",
        "__BlkBufferWriteSwitch": "0",
        ...有一个处理脚本案例结合了python json.tool和sed等:
curl -s 'http://api.icndb.com/jokes/random' \
| python -m json.tool \
| grep '\"joke\"' \
| cut -d ':' -f 2 \
| sed 's/"/\"/g'虽然我们可以用shell脚本来处理输出的json数据,但是,如果要依赖组合的 awk grep cut 显然非常繁琐,效率低下。
实际上工具 jq 可以帮助我们在shell脚本中处理json数据,特别适合解析一些REST返回数据。
举例
curl -s "http://api.icndb.com/jokes/random" | jq '.value.joke'举例,json数据如下
{ "foo": 123, "bar": 456 }我们要提取 foo 键的数据,则使用命令
echo '{ "foo": 123, "bar": 456 }' | jq '.foo'输出结果就是 123
echo '{ "Version Number": "1.2.3" }' | jq '."Version Number"'jq处理array
- jq 可以处理数组,使用 - .[]方法:
echo '[1,2,3]' | jq '.[]'对于数组的对象,采用如下方法:
echo '[ {"id": 1}, {"id": 2}  ]' | jq '.[].id'也可以用来获取 key/value 对的值:
echo '{ "a": 1, "b": 2  }' | jq '.[]'可以按照索引来获得array的值:
echo '["foo", "bar"]' | jq '.[1]'jq还包含了一些内建功能:
- 返回array的key: 
echo '{ "a": 1, "b": 2  }' | jq 'keys | .[]'则返回值是a和b。请注意,在jq中也可以使用管道|,这里就是表示提取出keys以后在通过索引.[]把所有key都输出出来。
- 可以返回array的长度 
echo '[1,2,3]' | jq 'length'使用jq创建对象
可以对json进行提取重整,例如:
echo '{"user": {"id": 1, "name": "Cameron"}}' | jq '{ name: .user.name  }'则输出就是
{
  "name": "Cameron"
}去除引号
默认jq输出的结果有双引号,这时候我们存储到字符串变量中会多出这对引号,虽然可以通过 tr 命令剥离,但是太麻烦了。实际上, jq 就有这个内置功能,参数 -r 会移除引号:
jq -r '.name' <json.txt多字段提取方法
{
    "users": [
        {
            "first": "Stevie",
            "last": "Wonder"
        },
        {
            "first": "Michael",
            "last": "Jackson"
        }
    ]
}如果需要一次提出多个字段,可以使用以下方法
jq '.users[] | .first + " " + .last'输出是:
Stevie Wonder
Michael Jackson这个方法非常优秀,我用它来处理一些非常复杂的嵌套json效率极高
类似也可以采用,输出效果相同
jq '.users[] | "\(.first) \(.last)"'另外一种多字段输出会换行:
jq '.users[] | ".first , .last'json字符串错误INvalid string
INvalid string我在使用脚本生成的json文件,发现 jq 解析报错
parse error: Invalid string: control characters from U+0000 through U+001F must be escaped at line 264, column 1在vs code中观察,可以看到报错提示: Unexpected end of string.json(258)
原因是我想在 "text" 中传递大段的markdown文本,但是很不幸,json规范不支持真正的行回车,只能通过 \n 来打断行。 - 参考 Unexpected end of string.json(258) 可以看到:
structure your data: break the multiline string into an array of strings, and then join them later on.
所以要将
{
    "text" : "line 1
    line 2
    line 3
    "
}修订为:
{
    "text" : "line 1\nline 2\nline 3"
}参考
Last updated
Was this helpful?