资源预览内容
第1页 / 共44页
第2页 / 共44页
第3页 / 共44页
第4页 / 共44页
第5页 / 共44页
第6页 / 共44页
第7页 / 共44页
第8页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
企业知识中台市场培训知识图谱部 仲夏 2020.1目录1、行业背景2、知识中台介绍3、成功案例4、售卖方式5、常见问题汇总6、Q&A今天,企业搜索面临的现状是?为什么企业需要知识?数据爆炸44ZB法律行业4亿卷宗医疗行业增长率48%/年行业数据体量巨大利用率低0.4%金融行业80%非结构化转化困难人工构建Freebase$2.25/条知识密集型服务业14大行业客服行业3000亿500万行业知识需求广泛人力成本企业搜索框,是在搜什么?交易、舆情、事件、机构、研报,关联关系行业研究、关联分析、风险挖掘、辅助决策商品、商户、订单、服务、供应商信息获取、个性化匹配、流量分发、智能推荐从通用到专业的全系统知识,从满足到决策的全方位需求,从对内到对外的全场景覆盖金融场景金融信息搜索电商场景商品搜索流程、规章、制度、组织结构、办公服务信息获取、流程自动化、企业资源管理内搜场景办公知识搜索业务规则、客户信息、运营数据业务查询、答案直接满足,营销推荐客服场景业务知识搜索搜索满足知识生产、加工、管理方向存在巨大市场商机行业跨度大、呈分散状,知识中台在各行各业都有需求数据知识化难知识获 取难知识组织形态原始难以支撑智能化应用知识管理、协同的难题宏观:政策趋势向好微观:知识需求强烈企业知识管理者面临的5个难题国家卫健委推进“智慧医院”建设金融科技(FinTech)发展规划2019-2021年最高人民法院关于加快建设智慧法院的意见关于推进互联网+智慧能源发展的指导意见智慧交通让出行更便捷行动方案(20172020年)行业:需求范围广目录1、行业背景2、知识中台介绍3、售卖方式4、成功案例5、常见问题汇总6、Q&A知识中台对应四个类型智能化专业度发现满足辅助决策通用知识专业知识 企业搜索 企业智能搜索 CDSS 金融风控 智能庭审 客服知识库 运维知识库 类案知识库 问诊知识库通用知识发现目标排序更合理、结果更相关数据更海量、效率更优化目标交互更智能、满足更直接内容更多态、结果更多样通用知识满足专业知识满足目标专业数据的知识化专业需求深度满足搜索直接对接业务目标知识驱动计算知识增强推理知识辅助分析专业辅助决策价值用知识中台重新定义企业搜索定义:企业知识全生命周期解决方案解决问题:企业知识分散、利用率低、应用效益差等核心问题对企业的价值:下接数据,上承业务,利用知识提升企业核心竞争力金融法律医疗能源军工电商物流数据交易 舆情事件 研报 机构 关联 文书 案件 法规 诉状 庭审笔录 药典 文献 专利 病历 药品说明书 设备 人员 维修记录 供应链 资料 文献人员 装备情报 舆论业务行业企业知识中台知识生产知识协作知识管理知识应用核心功能投资研究风险管理智能客服精准营销企业内搜智能庭审合规审查辅助量刑法规检索案例检索病例质控合理用药辅助诊断智能分诊病例搜索智能运维设备管理智能客服企业内搜装备管理情报分析企业内搜科研搜索医疗场景合理用药拦截90%用药问题,病历质控提升20倍人效降低医疗诉讼风险,提升诊疗质量法律场景提升庭审人员办案效率调解成功率达85%结案率提高一倍以上客服场景提升坐席应答能力40%服务满意度大幅提升运维场景提高故障处理可靠性、减少MTTR,为业务可用性保驾护航减少Oncall人力投入、提升故障恢复效率,运维效能最大化平台层和应用层多个产品组成知识中台产品矩阵定义:企业知识全生命周期解决方案解决问题:企业知识分散、利用率低、应用效益差等核心问题对企业的价值:下接数据,上承业务,利用知识提升企业核心竞争力平台层技术产品行业图谱 平台图数据库应用层SAAS产品企业搜索专业知识库支持场景内搜垂直搜索坐席知识库运维知识库营销知识库信息部、大数据部、人工智能实验室、IT部各业务部门对应客群应用产品(1) 企业搜索定义:解决企业内外部信息搜索不到、相关性差的核心问题产品目标:排序更合理、结果更相关,数据更海量、效率更优化对企业的价值:降本提效,可有效降低信息获取的单位时间,节省更多人力时间企业搜索产品功能客户群领先优势主要竞对知识管理搜索策略搜索功能搜索提示高级检索阿拉丁结果热门搜索问答结果数据接入FAQ抽取结构化知识知识生产知识优化结果干预搜索标签分词管理词表管理问答管理集团型跨行业 搜索效果好 精准知识类结果 策略可配置 多源数据接入应用产品(1) 企业搜索数据接入搜索策略搜索提示搜索结果显示来源系统二次筛选搜索提示多类型数据接入纠错词表应用产品(1) 企业搜索策略配置任务调度多源异构接入 OA WEB CRM SAP 文档 非结构化 其他源端适配器 结构化适配器 半结构化适配器 音频适配器 视频适配器 图片适配器接入处理 解密解压 数据统计 数据质量检测 目录匹配 断点续传 数据分发目标端适配器 结构化适配器 半结构化适配器 音频适配器 视频适配器 图片适配器输出 原始库 处理队列 数据资源目录 数据血缘任务配置优势1:多源多态数据的智能采集客户的多源多态数据能被方便的接入、适配、并支持实时、批量、全量的调度机制三种采集方式:实时接入、离线抽取、文件导入支持导入结构化、半结构化、非结构化数据支持任务调度、可视化配置离线数据源支持MySQL、Oracle、SQL Server、Hive、Gbase等常见数据库文件导入支持常见图片、视频、文档格式,支持本地文件导入以及分布式文件目录如HDFS导入实时接入支持kafka、RocketMQ应用产品(1) 企业搜索优势2:搜索排序更相关、更准确百度全球领先的自然语言处理能力,使得企业搜索的结果排序更相关、更准确,体现了语义化理解能力的升级查询策略精排基础相关性排序文本相关性倒排索引客户资源结果查询策略精排基础相关性排序文本相关性倒排索引客户资源结果语义精排语义相关性语义索引不相关传统倒排索引相关引入语义匹配技术应用产品(2) 专业知识库定义:面向企业内部知识管理人员的专业知识生产和应用产品,解决企业知识生产、协作、共享、传承问题产品目标:便捷的知识生产方式,知识智能应用,解决知识传承问题对企业的价值:核心数据资产知识化,知识得到智能化应用专业知识库产品功能客户群与竞品对比主要竞对知识生产知识协作知识共享知识门户搜索问答知识社区知识空间知识分享数据接入FAQ生产图谱知识知识审核知识优化百度百科百度知道培训考试知识地图积分体系知识密集型协作需求强优势优势劣势势知识应用更智能知识协作功能欠缺多源知识获取更便捷知识共享功能欠缺复杂的权限管理功能技术产品(1) 行业图谱平台定义:面向企业技术部门提供一套完整的图谱构建与应用平台产品目标:多类型数据构建知识图谱,知识智能应用,可对接多类上层应用业务对企业的价值:降低企业构建知识图谱成本,完善的图谱构建方法论,认知层AI能力工具化输出行业知识图谱平台客户群领先优势主要竞对知识定义知识图谱 构建知识图谱应 用搜索问答分析计算对话系统智能推理决策系统数据接入预置知识简单知识时序流程知识抽取图谱构建策略调优结果干预可视化技术部门数据量大应用场景 预置行业模型,便于冷启动 强大无结构文本抽取能力 大量更新的数据处理图谱能力 搜索问答、推理计算等复杂应用能力技术产品(1) 行业图谱平台12Schema定义-可视化schema平台-自底向上自动构建学习反馈-使用交互反馈-生产标 注反馈众包生产-专家固化模型-大规模知识生产-抽样审 核规则 -生产-审核-重训-规则设计-产出审核-产出重训规则 沉淀-整理已有规则-创立新规则技术产品(1) 行业图谱平台可灵活定制知识体系继承 复用 扩展 多元异构知识关系 流程 时序 事件 金融图谱知识模型事物公告事件舆情人物高管时序变迁决议停牌变更股权实控人实体动作时空文书通用知识模型客群结构化数据源映射导入Excel行列 数据库ER图优势1预置行业知识模型,提升项目冷启动能力技术产品(1) 行业图谱平台多态数据支持表格 网页 数据库 文本 图片 基于行业语言模型启动效果优异优势2模型与规则结合的无结构文档抽取知识能力技术产品(1) 行业图谱平台亿级吞吐,10ms级延迟支持增量、实时构建有效节省计算资源支持二次开发抽取、清洗、映射、消歧、择优、建边多通路独立更新提供不同的时效性保障按优先级融合生效抓取手动上传Dump文件知识知识抽取抽取数据仓库清洗清洗映射映射子库子库子库子库实体化消歧择优融合库建边schemaschema构建构建更新/调度数据源数据库订阅系统全量批量增量实时优势3大量更新的数据处理图谱能力技术产品(1) 行业图谱平台QQAA信用卡中年费最低的是哪个?龙卡普卡、龙卡金卡、金穗卡普卡、牡丹卡普卡哪个年费最高?龙卡普卡金穗卡金卡QQAA信用卡中金穗卡金卡年费比普卡高多少年费钱高80元/年便宜80元/年QQQAAA龙卡普卡年费龙卡金卡呢年费100元/年的信用卡有哪些?80元/年160元/年基础问法最值比较差值计算牡丹卡普卡、长城卡普卡龙卡普卡比龙卡金卡年费便宜多少钱?信用卡龙大普卡金穗金卡金穗普卡有效期20年80元/年年费有效期10年160元/年年费有效期15年80元/年年费优势4基于图谱的智能问答技术产品(2) 图数据库Bgraph技术领先性技术领先性功能丰富性功能丰富性非功能性优势非功能性优势灵活安全可控灵活安全可控源于百度知识图谱可信技术,产品化为商业图数据库领先业内主流图数据库性能指标C+实现的原生图存储和计算引擎在百度知识图谱应用中已实践5年多,每天数十亿次调用访问,具有毫秒级查询响应,提供99.99%的可用性多样的基础功能集成图模型、属性类型、实时更新数据一致性保护、支持schema-less、二级/全文索引丰富的图算子算法广度/深度优先遍历、子图算子、最短路径、环监测、PageRank等管理功能及可视化Restful API、SDK编程客户端、可视化功能、导入导出、备份恢复、监控高性能:在遍历、检索和实时深度关联分析上具有极高的性能高可用:支持多实例副本,具有实时容错能力,单实例的故障不会影响查询服务扩展性:能支持数亿级顶点的图数据库,能通过分片和副本分布式可扩展,满足业务的快速增长开放灵活性:支持Property Graph模型、Gremlin语言和特色的图算法。可灵活进行个性化业务模型开发国内自主研发,具有自主知识产品支持灵活的本地商业化订制化开发提供灵活高效的本地化技术服务能力近百项图数据库、知识图谱论文及专利技术申请 百度大规模分布式图数据库BGraph技术产品(2) 图数据库Bgraph在同等条件下,将Bgraph与其他数据库比较使用Stanford开放社交数据soc-pokec(包含163万实体和3062万条边),分别测试1-3层遍历返回10条数据的QPS结论:Bgraph的性能优势明显,且遍历层数越高,差异化优势越大目录1、行业背景2、知识中台介绍3、成功案例4、售卖方式5、常见问题汇总6、Q&A应用案例(1)金融坐席知识库项目 提供知识构建、多源异构数据的图谱化、知识存储、知识检索等功能。 基于智能精准问答、语义化检索能力,对接智能客服,坐席助手。知识维护 效率提升100% 为企业节省80%人员成本检索效果 准确率高达90% 10余种结果类型 支持推理计算问题学习系统 self-learning system 无监督系统自学习 效果越用越好 应应用效果应用案例(2)金融知识抽取项目客户主要需求:1 快速抽取指定业务场景的知识2 将抽取的知识应用对接业务系统背景解决方案项目价值投入使用周期:已1年n效率提升:2.5万文档/年提升至0.8万文档/月n节省人力:原投入10RD,平台化处理后减少为7RD投入n直间接创收:n通过平台训练模型,新增训练8个文书类型,增加的训练场景间接为企业创收 知识建模 抽取平台 效果产出8类文本类型抽象125个抽取字段训练模型+参数调整+规则匹配快速产出+更多场景模型训练参数调整数据清洗发行价格担保比例付息频率评级等级发行方式招标方式高准确率更多场景短调优耗时应用案例(3)能源行业搜索+知识图谱项目工单记录业务知识能源行业图谱 制定ID方案 规范组织数据能源场景下语义化问答结构
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号