Skip to content

Latest commit

 

History

History
36 lines (32 loc) · 1.36 KB

exploring_your_data.md

File metadata and controls

36 lines (32 loc) · 1.36 KB

探索您的数据

样本数据集

我们已经学习了一些基础知识,现在让我们来处理一些更为现实的数据集。我准备了一个虚构的客户银行账户 JSON 文档,每个文档有如下的结构:

{
    "account_number": 0,
    "balance": 16623,
    "firstname": "Bradshaw",
    "lastname": "Mckenzie",
    "age": 29,
    "gender": "F",
    "address": "244 Columbus Place",
    "employer": "Euron",
    "email": "[email protected]",
    "city": "Hobucken",
    "state": "CO"
}

我是通过网站www.json-generator.com/生成这些数据的,所以请忽略这些数据的实际意义,它们都是随机生成的。

装载数据

你可以从这里下载样本数据(accounts.json),解压文件到当前目录并按照以下命令把数据装载到集群:

curl -XPOST 'localhost:9200/bank/account/_bulk?pretty' --data-binary "@accounts.json"
curl 'localhost:9200/_cat/indices?v'

响应:

curl 'localhost:9200/_cat/indices?v'
health index pri rep docs.count docs.deleted store.size pri.store.size
yellow bank    5   1       1000            0    424.4kb        424.4kb

上面的响应意味着我们刚刚成功的批量索引了1000个文档到bank索引(在account type下)。