Skip to content
/ flysnow Public

流式计算小程序,统计数据可自动归档

Notifications You must be signed in to change notification settings

panjjo/flysnow

Repository files navigation

flysnow

运行

配置好配置文件和统计项
go run parser.go
go run main.go

配置文件

例如:

    redis:
      host: redis.base:6379      # redis 地址
      maxConn: 100               # 最大连接数
      db: 1                      # redis 存放db
      prefix: fs                 # redis 数据前缀
    mongo:
      host: mongodb://mongo.base:27017   # mongo地址
      dupl: clone                        # mongo 连接方式
      prefix: FS                         # mongo 库名前缀
    rabbitmq:
      queue: 1                                           # 是否开启队列接收数据
      host: amqp://guest:[email protected]:5672/kabao  # 队列地址
      name: flysnow                                      # 队列名称
      exchange: topic.kabbao                             # exchange 名称
      extype: topic                                      # exchange 类型
    autoRotate: 0 0 3 * * *  # s min h d m week        # 自动归档定时
    maxRotateNums: 20                                  # 最大自动归档并发数
    datapath: ./btreefiles                             # 永久存储btree文件存放目录
    logger: debug                                      # 日志等级
    listen: 0.0.0.0:22258                              # 监听地址和端口

统计项配置

./data/ 例如 统计数据源为order 在data目录下创建order文件夹

  data/
    order/                              #数据源json路径,一个数据源对应一个目录
      main.json                         #主json文件,含有请求数据格式,自定义函数等配置
      xx1.json                          #项文件,包含统计结果唯一key设置,计算规则,rotate规则等
      xx2.json                            每个项文件只能设置一种结果唯一key规则,如统计每个店铺订单量,统计结果唯一key为shopid,如果也需要
      xx3.json                            统计所有店铺每天订单量,统计结果唯一key为date,则此为两个项统计,需写两个文件
      xxn.json                            相同唯一key尽量写入同一个项文件
    shop/
      main.json
      xxxx.json

配置文件解析

  main.json
     {
       "name":"order",                  #数据源名称
       "reqdata":{                      #请求数据结构
         "shopid":"string",             #key为字段名,value为字段值类型(所支持的字段类型请看下面)
         "orderid":"string",
         "total":"float64",
         "day_total":"float64",
         "member_num":"float64",
         "items":"$listkv"             #$开头的为系统自定义结构(详情看 数据类型)
         },
       "filter":[                       #自定义过滤器
         {
           "name":"order_filter",       #过滤器名称
           "offset":120,                #数据失效时长 和duration同时使用,设置为0标识永不失效
           "whence":0,                  #时长计算类型 (详情看 过滤器定制)
           "duration":"s",              #时长单位 s 秒 h 小时 d 天 m 月 y 年
           "persistence":true           #是否永久存储,true:永久存储 存储硬盘启动是从硬盘加载数据,false:每次启动创建一个空过滤器
           }
         ]
     }
  xxx.json
     {
       "name":"all",                    #项名称
       "key":["counts","@shopid"],      #唯一key 列表  @为取请求数据中的字段值 下同
       "execs":[                        #执行操作
         {                              
           "filter":[
              "&&",
              ["==","@status","succ"], #执行条件 采用S-expression规则 即第一个元素为操作符,其余为变量,详情  https://en.wikipedia.org/wiki/S-expression
              ["$order_filter","@orderid"] # 调用过滤器过滤orderid ,此条件解析为 数据中status的值为succ并且orderid过滤不存在
           ],
           "do":[                       
             ["+","succ",1],            # do 为执行操作的具体操作 
             ["+","total","@total"],    # 此操作为 total 值加上 传入的total值,@开头表示获取请求参数的值
             ["+","@shopid",1]          # 此为将传入字段中shopid作为key值加1
             ["+","@items"]             # 特殊结构,会有特殊结构的计算方式,详情见下方自定义结构的解释
           ]                            
         },                            
         {
           "filter":["!=","@code","0"],
           "do":[
             ["+","fail",1],
             ["+","@code",1],
             ["+","total",1],
             ["avg","day_total","@day_total"],     #特殊操作符,计算平均值 详情见特殊操作符解释
             ["last","memeber_num","@member_num"]  #特殊操作符,计算最新值 详情见特殊操作符解释
           ]
         }
       ],
       "snow":[
         {
           "interval":1,                #每条数据时长
           "intervalduration":"h",      #类型
           "timeout":1,                 #保存时长
           "timeoutduration":"d"        #类型
         },                             # 每个小时一条数据 存储最近1天数据,注意此处interval为whence=0,timeout为whence=1 (详情看 过滤器定制解释中的whence)
          {
           "interval":1,                #一天一条数据,存储最近一个月的数据
           "intervalduration":"d",
           "timeout":1,
           "timeoutduration":"m"
         }
       ],                                #此配置可查询此项统计数据1天(24小时)内任意小时的数据,查询一个月(30天)内任意天的数据,一个月以前的数据只能查看一个总数

     }

数据类型

string  字符串
float64 数值型(为了方便计算,int int64 float32 float64 统一设置为float64)
bool    布尔型
$listkv 列表型 此类型主要用于循环计算 如计算店铺内所有商品销售总额,数据源为order itmes为$listkv类型 [{key:key1,value:value1},{key:key2,value:value2}]
              使用+运算符表示执行循环操作 将统计数据的key1 和key2的值分别加value1,value2

运算符

条件

操作符        参数                              返回
+          interface,interface....             interface
==         interface,interface                 bool
&&         bool,bool,bool.....                 bool
!=         interface,interface                 bool
||         bool,bool,bool.....                 bool
$filter    string                              bool           # 过滤器类型函数,系统自动加入s_time参数

Do
Do 类型操作是针对redis操作 +=表示key.value+value

操作符        参数                            
+          interface,float64
avg        interface,float64                                 # 平均值计算 例如 [avg ,key, @key] 在计算和归档时会生成一个@num_key字段记录次数,key值进行累加,在获取统计返回时 @key=key,key=key/@num_key
last       interface,float64                                 # 最新值计算,永远使用新值覆盖老值,数据不做其他计算,只做替换

示例:

do:["+","@shopid",["+","@order_total","@order_discount"]]       #表示给key为shopid的值加上(order_total+order_discount)
                                                                     shopid+=order_total+order_discount
                                                                #只要使用合适,可以无限嵌套

自定义函数

过滤器

过滤器是针对数据源使用,一次定义在此数据源中的所有统计项中皆可使用
过滤器使用可永久存储的btree实现
whence  0 表示类似自然年的概念,1 则相反
   例:
      offset=1
      whence=0
      duration=d
      表示获取今天0点到现在的数据  表达式 start:now-now%(offset*duration) end:now-now%(offset*duration)+offset*duration
      offset=1
      whence=1
      duration=d
      表示获取昨天此时到现在的数据 表达式 start:now-offset*duration end:now

About

流式计算小程序,统计数据可自动归档

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages