首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

轻量级中文分词器

概述 引:轻量级中文分词器 Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接...特性 1、中文分词:mmseg算法 + Jcseg 独创的优化算法四种切分模式。 2、关键字提取:基于textRank算法。 3、关键短语提取:基于textRank算法。...(4).检索模式:细粒度切分,专为检索而生,除了中文处理外(不具备中文的人名,数字识别等智能功能)其他与复杂模式一致(英文,组合词等)。...中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且 Jcseg会自动将其转换为阿拉伯数字加入到分词结果中。如:150, 1/40。...智能中文人名/外文翻译人名识别。中文人名识别正确率达94%以上。

1.8K30
您找到你想要的搜索结果了吗?
是的
没有找到

GitHub 项目推荐 | 轻量级中文 OCR

今天和大家介绍一个超轻量级中文 OCR 项目,目前这个项目已在 GitHub 上标星 6.7k。...本项目基于 chineseocr 与 psenet 实现中文自然场景文字检测及识别,支持竖排文字识别,支持 ncnn、mnn、tnn 推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet...环境 python3.6 linux/macos/windows web服务启动 cd chineseocr_lite python backend/main.py 如此轻量级的模型,识别效果如何呢,话不多说...ncnn C++ demo,支持 Windows、linux、macOS,分为 cpu 版与 gpu 版,gpu 版使用 ncnn+vulkan 来支持 gpu 加速。...第三方 Demo 根据本项目,基于 TNN 实现的轻量级中文字符 ocr demo,支持 iOS 和 Android 系统,凭借 TNN 优化的 CPU(ARMv7、ARMv8) 和 GPU(OpenCL

2.7K10

SFS轻量级Linux工具箱

github项目地址 https://gitee.com/sfstool/sfs 工具箱简介 image.png 工具箱简介 SFS轻量级Linux工具箱是一款免费运维工具箱, 工具箱内集成一键自动化处理脚本与半自动化处理脚本...工具箱脚本存储于国内服务器,每个功能执行速度提升无需等待, 简洁易懂的工具箱首页面板数字化执行命令, 多样化功能菜单提升Linux运维效率 一键自动化脚本安装无需分布式部署 轻量级工具箱占用内存低于...VPS攻防工具(功能多达数十个自由配置一键自动化部署) 巡检违规词系统(巡检服务器/web内敏感词并拦截自定义拦截页面邮箱提示) SEO推送工具(集成多个终端自动爬站点url并且推送各大搜索引擎) Linux...软件源(集成全国Git软件源一键自动化脚本) Aria2自动化一键部署脚本 更多功能请前往SFS工具箱http://www.sfs0.cn查看更新代谢 工具箱每个功能菜单支持快捷启动 融洽各种Linux

1.7K20
领券