UNIT系统槽位归一化格式说明
陆仁贾wzl 发布于2017-12 浏览:2472 回复:3
1
收藏

UNIT会对识别的sys_time、sys_time_interval、sys_unit、sys_loc等系统槽位做归一化处理,归一化的格式如下(三列分别为词槽内容、归一化结果、格式说明):

一、sys_time

8月7号            2017-08-07              没有指明年份,默认当年
7号               2017-08-07              没有指明年月,默认当年当月
下午三点           15:00:00               只有时间点,不会默认日期
上午              09:00:00                “早上”、“上午”、“中午”、“下午”、“晚上”、“凌晨”的归一化结果分别为“07:00:00”、“09:00:00”、“12:00:00”、“14:00:00”、“18:00:00”、“01:00:00”
明天下午三点     2017-12-29|15:00:00       日期和时间以“|”分割
8月              2017-08-00              没有指明几号,归一化给00
2018年           2018-00-00              没有指明几月几号,归一化给00-00

二、sys_time_interval

周二到周五	    2017-12-26~2017-12-29                        “~”为时间区间的连接符号
今天下午到明天上午     2017-12-28|14:00:00~2017-12-29|09:00:00      “~”为时间区间的连接符号
16到18号             2017-12-16~2017-12-18                        没指定年月,默认给当年当月

三、sys_unit

第三集                3.000000|集                    数字和单位以“|”分割
一公里                1000.000000|米                 
一百块                100.000000|元                  
一百亩	             66666.666600|平方米
三星期	             21.000000|天
一分50秒              110.000000|秒
2钟头                 2.000000|小时

四、sys_loc

西二旗           (NERL_PLUS_LOC_ROOT)>(北京市)>(海淀区)>西二旗              归一化结果里说明了地址的层级关系
顺义             (NERL_PLUS_LOC_ROOT)>(北京市)>顺义区        
北戴河	        (NERL_PLUS_LOC_ROOT)>(河北省)>(秦皇岛市)>北戴河区
收藏
点赞
1
个赞
共3条回复 最后由15053535385回复于2017-12
#415053535385回复于2017-12

有点看不懂

0
#3zr0519回复于2017-12

果然专业!

0
#2伊茨米可回复于2017-12

果然专业!

0
TOP
切换版块