首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Reactjs开发自制编程语言Monkey的编译器:高能技术干货之语法高亮1

使用各种IDE编写代码时,其有一个功能是关键字高亮,当你敲下的字符串形成编程语言的关键字时,它的颜色会比普通变量更加靓丽显眼,而且这种高亮是即时的,当你在编辑器上敲下”if”两个字母时,这两个字母的颜色会变成引人注目的红色,当你在”if”后面添加其他字符时,字符串的颜色就会从显眼的红色转变为令人难以察觉的浅色,例如白色。关键字的即时高亮是一个难度很大技术点,由于我们自创的Monkey编程语言所使用的IDE是网页版,在web上实现关键字高亮更是颇费周折,本节技术含量很大,完成本节后,你的数据结构,算法,设计

03

【问底】严澜:数据挖掘入门——分词

谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头也在积极布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不过买来的数据挖掘书籍一打开全是大量的数学公式,而课本知识早已还给老师了,着实难以下手、非常头大! 我们不妨先跳过数学公式,看看我们了解数据挖掘的目的——发现数据中价值。这个才是关键,如何发现数据中的价值。那什么是数据呢?比如大家要上网

09

【从零开始学分词】严澜:数据挖掘入门——分词

谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头也在积极布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不过买来的数据挖掘书籍一打开全是大量的数学公式,而课本知识早已还给老师了,着实难以下手、非常头大! 我们不妨先跳过数学公式,看看我们了解数据挖掘的目的——发现数据中价值。这个才是关键,如何发现数据中的价值。那什么是数据呢?比如大家要

04

python格式化方法

%[(name)][floags][width].[precision]typecode (name) 可选,用于选择指定的key flags 可选,可提供的值有: · + 右对齐,整数前加正号,负数前加负号 · - 左对齐,正数钱无符号,负数前加负号; · 空格 右对齐;正数前加空格,负数前加负号 · 0 右对齐,正数前无符号,负数前加负号;用0填充 width 可选,占有宽度 typecode 必选 %s 字符串(str()的显示) %r 字符串采用repr()显示 %c 单个字符 %b 二进制整数 bin %i 十进制整数 int %o 八进制整数 oct %x 十六进制整数 hex %f 浮点数 %e 指数 %% 字符% (前提是里面要有格式符的话需要这么写) 案例: a = "i am %s" % "alex" a = "i am %s age %d " % ("alex",18) a = "i am %(name)s age %(age)d" % {"name":"alex","age":18} a = "percent %.2f" % 99.98234 a = "i am %(pp).2f" % {"pp":123.3245} a = "i am %.2f %%" % {"pp":123.3223455} 二、函数方法 format

02

达观数据告诉你机器如何理解语言 -中文分词技术

前言 中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。 一、分词算法分类 中文分词算法大概分为三大类。 第一类是基于字符串匹配,即扫描字符串,如果发现字符串的子串和词典中的词相同,就算匹配,比如机械分词方法。这类分词通常会加入一些启发式规则,比如“正向/反向最大匹配”,“长词优先”等。 第二类是基于统计以及机器学习的分词方法,

07

投稿 | 机器如何理解语言—中文分词技术

前言 中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。 一、分词算法分类 中文分词算法大概分为三大类: 第一类是基于字符串匹配,即扫描字符串,如果发现字符串的子串和词典中的词相同,就算匹配,比如机械分词方法。这类分词通常会加入一些启发式规则,比如“正向/反向最大匹配”,“长词优先”等。 第二类是基于统计以及机器学习的分词方法,

05
领券