我正在寻找关于阅读食谱食谱的人工智能技术的研究(出版)。食谱是一个非常有限的领域,在自然语言识别引擎中可以做到一定程度的准确性。
我正在考虑编写一个程序,允许从web浏览器将食谱复制/粘贴到AI中,并让AI通过“读取”食谱来确定标题、作者、成分、说明、营养信息等。我也希望能够处理PDF文件(我有一个很大的收藏),也许也只是使用复制/粘贴。
输出将是某种(标准的)基于XML的格式,配方管理器可以读取该格式。
我考虑的是PhD或硕士级别的工作。
发布于 2010-08-27 10:01:33
AI中你可能会发现相关的一个子领域是。
信息提取算法通常通过使用规则(例如正则表达式)来识别文本中的实体和关系。这些规则既可以手动定义(即Suiseki算法),也可以使用有监督的机器学习算法(即RAPIER、Wrapper Induction、Conditional Random Field)来学习。
例如,信息提取算法可能会从职务发布中获取数据:
Job Title
:高级数据库管理系统顾问
Location
:德克萨斯州达拉斯
Responsibilities
:数据库管理系统应用程序顾问与项目团队一起定义基于数据库管理系统的解决方案,以支持电子商务、销售队伍自动化和客户服务应用程序的企业部署。
Desired Requirements
:3-5年经验使用Visual Basic、C/C++、Powerbuilder、Progress或类似工具开发Oracle或SQL Server应用程序。最近在两个开发环境中安装和配置Oracle或SQL Server的经验。和部署环境。
Desired Skills
:了解UNIX或NT,脚本语言。了解结构化软件工程和项目管理的原理
...and将其提取到以下模板中:
title
:高级数据库管理系统顾问
state
:TX
city
:达拉斯
country
:美国
language
:Powerbuilder,Progress,C++,Visual Basic
platform
:UNIX、NT
application
:SQL Server、Oracle
area
:电子商务,客户服务
required years of experience
:3
desired years of experience
:5
德克萨斯大学奥斯汀分校的Ray Mooney和他的团队在信息提取方面做了一些很好的工作。以下是一些参考资料,可以作为很好的起点:
,
https://stackoverflow.com/questions/3565660
复制相似问题