前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >原始语料库

原始语料库

作者头像
K同学啊
发布2019-01-22 15:00:04
7950
发布2019-01-22 15:00:04
举报

第一步: 判断数据中是否存在重复数据 创建python文件–

代码框架

'''
author: kzb
time: 2018-12-10
'''

import pandas			as pd
import os,csv

dataPath = os.path.join("音译原始数据.csv")

def import_data(dataPath):
	'''
	导入文件中的数据
	return:dataFrame
	'''
	pass

def find_En_Cn_excess(dataFrame):
	'''
	查出EnName、CnName列中存在多余数据的项
	例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的昵称)”
	param:dataFrame
	return:dataFrame
	'''
	pass

def write_to_file(dataFrame):
	'''
	将数据写入文件中
	param:dataFrame
	'''
	pass

def main():
	'''
	程序入口
	'''
	pass

if __name__ == '__main__':
	main()
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年12月10日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档