我们已经学习了一些基础知识,现在让我们来处理一些更为现实的数据集。我准备了一个虚构的客户银行账户 JSON 文档,每个文档有如下的结构:
{
"account_number": 0,
"balance": 16623,
"firstname": "Bradshaw",
"lastname": "Mckenzie",
"age": 29,
"gender": "F",
"address": "244 Columbus Place",
"employer": "Euron",
"email": "[email protected]",
"city": "Hobucken",
"state": "CO"
}
我是通过网站www.json-generator.com/生成这些数据的,所以请忽略这些数据的实际意义,它们都是随机生成的。
你可以从这里下载样本数据(accounts.json),解压文件到当前目录并按照以下命令把数据装载到集群:
curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json"
curl 'localhost:9200/_cat/indices?v'
响应:
curl 'localhost:9200/_cat/indices?v'
health index pri rep docs.count docs.deleted store.size pri.store.size
yellow bank 5 1 1000 0 424.4kb 424.4kb
上面的响应意味着我们刚刚成功的批量索引了1000个文档到bank
索引(在account type
下)。