(本功能于 v1.1.0 发布)
JSON Pointer 是一个标准化(RFC6901)的方式去选取一个 JSON Document(DOM)中的值。这类似于 XML 的 XPath。然而,JSON Pointer 简单得多,而且每个 JSON Pointer 仅指向单个值。
使用 RapidJSON 的 JSON Pointer 实现能简化一些 DOM 的操作。
一个 JSON Pointer 由一串(零至多个)token 所组成,每个 token 都有 /
前缀。每个 token 可以是一个字符串或数字。例如,给定一个 JSON:
以下的 JSON Pointer 解析为:
"/foo"
→ [ "bar", "baz" ]
"/foo/0"
→ "bar"
"/foo/1"
→ "baz"
"/pi"
→ 3.1416
要注意,一个空 JSON Pointer ""
(零个 token)解析为整个 JSON。
以下的代码范例不解自明。
由于面向对象的调用习惯可能不符直觉,RapidJSON 也提供了一些辅助函数,它们把成员函数包装成自由函数。
以下的例子与上面例子所做的事情完全相同。
以下对比 3 种调用方式:
Pointer(source).<Method>(root, ...)
<Method>ValueByPointer(root, Pointer(source), ...)
<Method>ValueByPointer(root, source, ...)
Pointer::Get()
或 GetValueByPointer()
函数并不修改 DOM。若那些 token 不能匹配 DOM 里的值,这些函数便返回 nullptr
。使用者可利用这个方法来检查一个值是否存在。
注意,数值 token 可表示数组索引或成员名字。解析过程中会按值的类型来匹配。
"/0"
→ 123
"/1/0"
→ 456
Token "0"
在第一个 pointer 中被当作成员名字。它在第二个 pointer 中被当作成数组索引。
其他函数会改变 DOM,包括 Create()
、GetWithDefault()
、Set()
、Swap()
。这些函数总是成功的。若一些父值不存在,就会创建它们。若父值类型不匹配 token,也会强行改变其类型。改变类型也意味着完全移除其 DOM 子树的内容。
例如,把上面的 JSON 解译至 d
之后,
另外,RFC6901 定义了一个特殊 token -
(单个负号),用于表示数组最后元素的下一个元素。 Get()
只会把此 token 当作成员名字 '"-"'。而其他函数则会以此解析数组,等同于对数组调用 Value::PushBack()
。
当使用 p.Get(root)
或 GetValueByPointer(root, p)
,root
是一个(常数) Value&
。这意味着,它也可以是 DOM 里的一个子树。
其他函数有两组签名。一组使用 Document& document
作为参数,另一组使用 Value& root
。第一组使用 document.GetAllocator()
去创建值,而第二组则需要使用者提供一个 allocator,如同 DOM 里的函数。
以上例子都不需要 allocator 参数,因为它的第一个参数是 Document&
。但如果你需要对一个子树进行解析,就需要如下面的例子般提供 allocator:
Erase()
或 EraseValueByPointer()
不需要 allocator。而且它们成功删除值之后会返回 true
。
Pointer
在其建构函数里会解译源字符串。若有解析错误,Pointer::IsValid()
返回 false
。你可使用 Pointer::GetParseErrorCode()
和 GetParseErrorOffset()
去获取错信息。
要注意的是,所有解析函数都假设 pointer 是合法的。对一个非法 pointer 解析会造成断言失败。
除了我们一直在使用的字符串方式表示 JSON pointer,RFC6901 也定义了一个 JSON Pointer 的 URI 片段(fragment)表示方式。URI 片段是定义于 RFC3986 "Uniform Resource Identifier (URI): Generic Syntax"。
URI 片段的主要分别是必然以 #
(pound sign)开头,而一些字符也会以百分比编码成 UTF-8 序列。例如,以下的表展示了不同表示法下的 C/C++ 字符串常数。
字符串表示方式 | URI 片段表示方式 | Pointer Tokens (UTF-8) |
---|---|---|
"/foo/0" | "#/foo/0" | {"foo", 0} |
"/a~1b" | "#/a~1b" | {"a/b"} |
"/m~0n" | "#/m~0n" | {"m~n"} |
"/ " | "#/%20" | {" "} |
"/\0" | "#/%00" | {"\0"} |
"/€" | "#/%E2%82%AC" | {"€"} |
RapidJSON 完全支持 URI 片段表示方式。它在解译时会自动检测 #
号。
你也可以把一个 Pointer
字符串化,储存于字符串或其他输出流。例如:
使用 StringifyUriFragment()
可以把 pointer 字符串化为 URI 片段表示法。
若一个 pointer 会用于多次解析,它应该只被创建一次,然后再施于不同的 DOM ,或在不同时间做解析。这样可以避免多次创键 Pointer
,节省时间和内存分配。
我们甚至可以再更进一步,完全消去解析过程及动态内存分配。我们可以直接生成 token 数组:
这种做法可能适合内存受限的系统。