昆明东讯科技有限公司面向南亚东南亚科技信息大数据中心2018年建设情况

项目建设基于云计算的网络平台,采用大数据技术、网络爬虫技术、基于人工智能(AI)的多语种自动翻译技术等,建设基础支撑网络平台、科技大数据信息服务平台、基于O2O模式的科技中介服务平台、科技成果展示平台。

“面向南亚东南亚科技信息大数据中心”于2018年4月开始启动建设,年底完成了科技信息大数据中心基本构架和功能的规划和设计,依托原有东南亚南亚电子商务平台资源,完成了基础平台的搭建、相关平台的信息资源整合等工作,具体如下:

一、基础支撑平台建设

基于公司现有机房及网络条件,通过购置补充部分硬件设备、软件设备(数据库服务器、应用服务器、磁盘阵列存储器、交换机、防火墙等),并完成安装集成,以支撑整个系统的管理及应用服务。

二、业务支撑平台

根据建设实施工作的总体计划,2018年完成了互联网网络爬虫基础系统、基于人工智能(AI)的多语种自动翻译系统开发,为平台的建设实施提供了基础支撑:

1、互联网网络爬虫基础系统

采用数据爬虫方式,定向抓取互联网的信息资源,根据既定的抓取目标进行数据信息抓取,包括各国商务法律介绍、政策信息、产业研究、人才信息、科技信息、市场供求信息、投资信息、招投标信息、展会信息、项目信息、产品信息等信息资源,根据工作需要可以进行抓取目标、内容类别的调整。通过数据信息的抓取,获取所需要的数据信息。将数据信息按照分类建立相关的栏目,通过数据爬虫抓取的数据接口,实现将数据信息进行获取、分析、转化、存储放在分布式文件系统上,这样管理多个节点上的数据更加方便,提供给用户进行查询及应用。

本项目通过互联网信息自动爬虫采集技术采集南亚东南亚国家互联网上公开发布的各类信息,作为平台重要的商务信息数据来源。后期将采集到的数据信息进行翻译,为通过平台采集到的各种信息资源提供翻译服务,各个国家的用户提供科技信息服务。

目前正在开展通过大数据技术搜集南亚东南亚国家技术信息,包括:项目投资、企业信息、产业研究、市场动向、科技活动、专利发明等方面的科技信息,为国内科研机构、企业、人才团队走向南亚东南亚提供科技数据支持,并对相关竞争对手数据进行跟踪分析,通过大量的情报信息借鉴、比较、学习对方的先进技术和管理方法。基于大数据资源,提供科学、准确、全面的全市科技型企业行情统计分析应用,为市政府及企业的科学决策提供参考建议和数据支撑,服务各级政府领导的日常宏观经济调控决策。

2、基于人工智能(AI)的多语种自动翻译系统

开发建设基于人工智能(AI)的多语种自动翻译系统,实现基于人工智能(AI)的多语种自动翻译系统的基础技术研发,目前实现了:缅甸、泰国、越南、柬埔寨、老挝、印度、孟加拉、巴基斯坦、斯里兰卡等国家语言的翻译,多语种自动翻译系统通过PC端实现了对整个信息内容的翻译应用,同时,为了推动整个多语种自动翻译系统今后的方便应用,将多语种自动翻译系统向社区服务及移动终端进行延伸,目前开发建设了云海国际商务社区平台,基于移动终端APP,实现了商务交流、沟通和在线的翻译。实现了全自动的多国语言自动翻译。

通过搭建小语种翻译综合系统,为企业提供机器翻译应用平台、为最终用户提供即时沟通及在线翻译服务。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190212F0WZGI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券