农业知识图谱是融合了农业地域性,季节性,多样性等特征后,利用农业领域的实体概念与关系,挖掘出农业潜在价值的智能系统 应用场景: 通用 vs 领域/行业应用 从搜索延伸至推荐、问答等复杂任务 从简单关系发现到深层关系推理 从回答what问题到回答why问题 从关键词交互到更自然的人机对话式交互 技术生态: 机器学习 深度学习 自然语言处理 数据挖掘 知识图谱 在本项目中,我们训练了一系列基于深度学习的神经网络模型(word2vec模型,end2end模型等)。 在传统框架下,实现这些模型需要耗费大量的精力,且很难保证模型的正确性。此外,传统框架...
大数据工作流调度平台是一个 Python功能 模块,可以构建复杂的批量作业管道。处理依赖决议、工作流管理、可视化展示等等,内建 Hadoop 支持。 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python等。 这些任务需要不同的运行环境,并且除了定时运行,各种类型之间的任务存在依赖关系。 大数据工作流调度平台支持以上脚本并提供调度依赖管理,脚本管理,定时任务等功能...
可视化数据同步系统是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据同步任务,RDBMS数据源可批量创建数据同步任务,支持实时查看数据同步进度及日志并提供终止同步功能,集成并二次开发xxl-job可根据时间、自增主键增量同步数据。 任务"执行器"支持集群部署,支持执行器多节点路由策略选择,支持超时控制、失败重试、失败告警、任务依赖,执行器CPU.内存.负载的监控等等。后续还将提供更多的数据源支持、数据转换UDF、表结构同步、数据同步血缘等更为复...