当前位置: 首页 > news >正文

哪些软件可以做网站设计如何在网站上做背景图片怎么做

哪些软件可以做网站设计,如何在网站上做背景图片怎么做,科技公司起名,海宁做网站的公司Unity Android 之 使用 HanLP 进行句子段落的分词处理#xff08;包括词的属性处理#xff09;的简单整理 目录 Unity Android 之 使用 HanLP 进行句子段落的分词处理#xff08;包括词的属性处理#xff09;的简单整理 一、简单介绍 二、实现原理 三、注意事项 四、效…Unity Android 之 使用 HanLP 进行句子段落的分词处理包括词的属性处理的简单整理 目录 Unity Android 之 使用 HanLP 进行句子段落的分词处理包括词的属性处理的简单整理 一、简单介绍 二、实现原理 三、注意事项 四、效果预览 五、实现步骤 六、关键代码 附录在 HanLP 中Term 对象的 nature 字段表示词性 一、简单介绍 Unity Android 开发上会用到的技术简单整理方便自己日后查看能帮助到大家就更好了。 本节介绍Unity 开发中把从 Android 封装HanLP 的分词功能在 Unity 中进行调用的方法整理封装给Unity调用方法不唯一欢迎指正。 在 Android 平台上除了 HanLP还有其他一些可以用于中文分词处理的算法和工具。以下是一些常见的中文分词算法以及 HanLP 在分词中的一些优势 常见的中文分词算法和工具     ansj_seg ansj_seg 是一个基于 CRF 和 HMM 模型的中文分词工具适用于 Java 平台。它支持细粒度和粗粒度的分词并具有一定的自定义词典和词性标注功能。     jieba jieba 是一个在 Python 中广泛使用的中文分词库但也有其 Java 版本。它采用了基于前缀词典的分词方法并在速度和效果方面表现出色。     lucene-analyzers-smartcn 这是 Apache Lucene 项目中的一个中文分词器使用了基于规则的分词算法。它在 Lucene 搜索引擎中被广泛使用。     ictclas4j ictclas4j 是一个中科院计算所开发的中文分词工具基于 HMM 模型。它支持自定义词典和词性标注。 HanLP 分词的优势     多领域适用性 HanLP 被设计为一个面向多领域的中文自然语言处理工具包不仅包括分词还支持词性标注、命名实体识别、依存句法分析等多种任务。     性能和效果 HanLP 在多个标准数据集上进行了训练和优化具有较好的分词效果和性能。     灵活的词典支持 HanLP 支持自定义词典你可以根据需要添加专业领域的词汇以提升分词效果。     开放源代码 HanLP 是开源的你可以自由使用、修改和分发有利于定制和集成到你的项目中。     多语言支持 HanLP 不仅支持中文还支持其他语言如英文、日文等为跨语言处理提供了便利。     社区活跃 HanLP 拥有活跃的社区和维护团队有助于解决问题和获取支持。 总之HanLP 是一个功能丰富且性能优越的中文自然语言处理工具适用于各种应用场景特别是在多领域的文本处理任务中表现出色。然而最终的选择取决于你的具体需求和项目背景。   HanLP 官网HanLP | 在线演示 HanLP GitHubGitHub - hankcs/HanLP: 中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理 二、实现原理 1、在 Android 端 使用 StandardTokenizer.segment(text) 传入文本 Text 内容进行分词使用 Term.word; 获取分词内容Term.nature.toString() 获取分词的属性 2、把安卓端封装的功能接口暴露给 Unity 调用 /*** 开始分词* param wordsContent* return 返回分词结果和此属性*/public String segmentWork(String wordsContent) 3、在 Unity 端获取 Android 端的对象接口并简单处理信息使之更适合在Unity端使用 MAndroidJavaObject.Callstring(segmentWork, wordsContent) 三、注意事项 1、中文的词会有对应较为准确的此属性英文可能没有 2、Android 与 Unity 交互一般只能传递基础数据类型列表对象的高级对象可能传递不了这里把列表对象数据组装成字符串进行传递给 Unity Unity 在根据 string 解析拆出对应信息 四、效果预览 这里词性只做了简单的对应需要更多对应可以参见附录词性信息 五、实现步骤 HanLP 包hanlp-portable-1.7.5.jar 获取可以在这里直接在 Android Studio 中下载 Android Studio 之 Android 中使用 HanLP 进行句子段落的分词处理包括词的属性处理的简单整理 1、打开 Android Studio 创建一个模块工程添加 hanlp-portable-1.7.5.jar 包 注意记得添加为库 2、创建脚本添加分词功能 3、创建一个 Unity 工程把编译生成的 aar 给添加到 Unity 中 4、 在 Unity 中创建脚本调用 Android 中封装的接口并编写脚本测试功能 5、把测试脚本添加到场景中 6、打包安装到机子上运行效果如上 六、关键代码 1、TestChineseSegmentationHanlpHelper.cs using System.Collections.Generic; using UnityEngine;public class TestChineseSegmentationHanlpHelper : MonoBehaviour {// Start is called before the first frame updatevoid Start(){ListSegWordStrct segWordStrcts ChineseSegmentationHanlpHelper.SegmentWords(今天深圳的天气如何);foreach (var word in segWordStrcts){Debug.Log(${word.word},{word.WordAttribute});}} } 2、ChineseSegmentationHanlpHelper.cs using System.Collections.Generic; using UnityEngine;/// summary /// 句子段落中文分词助手 /// /summary public class ChineseSegmentationHanlpHelper {#region Datastatic AndroidJavaObject _mAndroidJavaObject;protected static AndroidJavaObject MAndroidJavaObject{get{if (_mAndroidJavaObject null){_mAndroidJavaObject new AndroidJavaObject(com.ffalcon.chinesesegmentationhanlphelper.HanlpHelper);}return _mAndroidJavaObject;}}#endregion/// summary/// 中文句子分词/// /summary/// param namewordsContent分词的内容/param/// returns分词的结果/returnspublic static ListSegWordStrct SegmentWords(string wordsContent){wordsContent wordsContent.Trim();if (string.IsNullOrEmpty(wordsContent)) return null;string[] dataArray MAndroidJavaObject.Callstring(segmentWork, wordsContent).Split(,);if (dataArray!null dataArray.Length0){List SegWordStrct rltLst new ListSegWordStrct();int length dataArray.Length;for (int i 0; i length; i 2){rltLst.Add(new SegWordStrct() { word dataArray[i],WordAttribute GetPosInfo(dataArray[i1])});}return rltLst;}return null;}/// summary/// 简单获取词的属性/// /summary/// param namepos属性标签/param/// returns/returnsprivate static string GetPosInfo(string pos){// 这里你可以根据需要添加更多的判断逻辑来确定词性属性if (pos.Equals(n)){return WordAttributeStrDefine.Noun;}else if (pos.Equals(v)){return WordAttributeStrDefine.Verb;}else if (pos.Equals(ns)){return WordAttributeStrDefine.PlaceName;}else if (pos.Equals(t)){return WordAttributeStrDefine.Time;}else{return WordAttributeStrDefine.Other;}} }/// summary /// 数据分词结构 /// /summary public struct SegWordStrct {public string word;public string WordAttribute; }/// summary /// 此属性文字定义 /// 较多这里只定义了部分 /// /summary public class WordAttributeStrDefine {public const string Noun 名词;public const string Verb 动词;public const string PlaceName 地名;public const string Time 时间;public const string Other 其他; } 3、HanlpHelper.java package com.xxxx.chinesesegmentationhanlphelper;import com.hankcs.hanlp.seg.common.Term; import com.hankcs.hanlp.tokenizer.StandardTokenizer;import java.util.ArrayList; import java.util.List;/*** 分词处理助手*/ public class HanlpHelper {/*** 开始分词* param wordsContent* return 返回分词结果和此属性*/public String segmentWork(String wordsContent){// 进行分词ListTerm terms StandardTokenizer.segment(wordsContent);if(terms!null terms.size()0){ListString rltWordAttr new ArrayList();// 遍历分词结果判断词性并打印for (Term term : terms) {String word term.word;String pos term.nature.toString();String posInfo getPosInfo(pos); // 判断词性属性System.out.println(Word: word , POS: pos , Attribute: posInfo);rltWordAttr.add(word);rltWordAttr.add(pos);}String[] dataArray rltWordAttr.toArray(new String[0]);return String.join(,, dataArray);}return null;}/*** 判断词性属性* param pos* return*/public String getPosInfo(String pos) {// 这里你可以根据需要添加更多的判断逻辑来确定词性属性if (pos.equals(n)) {return 名词;} else if (pos.equals(v)) {return 动词;} else if (pos.equals(ns)) {return 地名;}else if (pos.equals(t)) {return 时间;}else {return 其他;}} }附录在 HanLP 中Term 对象的 nature 字段表示词性 在 HanLP 中Term 对象的 nature 字段表示词性Part of SpeechPOS。HanLP 使用了一套标准的中文词性标注体系每个词性都有一个唯一的标识符。以下是一些常见的中文词性标注及其含义     名词类         n普通名词         nr人名         ns地名         nt机构名         nz其他专名         nl名词性惯用语         ng名词性语素     时间类         t时间词     动词类         v动词         vd副动词         vn名动词         vshi动词是         vyou动词有     形容词类         a形容词         ad副形词     副词类         d副词     代词类         r代词         rr人称代词         rz指示代词         rzt时间指示代词     连词类         c连词     助词类         u助词     数词类         m数词     量词类         q量词     语气词类         y语气词     叹词类         e叹词     拟声词类         o拟声词     方位词类         f方位词     状态词类         z状态词     介词类         p介词     前缀类         h前缀     后缀类         k后缀     标点符号类         w标点符号 请注意上述只是一些常见的词性标注及其含义实际情况可能更复杂。你可以根据需要调查 HanLP 的文档来了解更多词性标注的详细信息。根据这些词性标注你可以编写代码来判断词的属性如动词、名词、地名等并进行相应的处理。
http://www.pierceye.com/news/647848/

相关文章:

  • qq钓鱼网站怎么制作扬州网站建设哪个好薇
  • 域名和网站空间怎么做解析南阳seo网站推广费用
  • 烟台企业网站建设国内ui网站有哪些
  • 手机网站建设选 朗创营销电商运营的核心公式
  • seo网站排名软件飞机网页设计实训报告
  • 禹城做网站做网站的教科书
  • 基木鱼建站公众号怎么做网站
  • 无水印做海报的网站百度技术培训中心
  • 如何在阿里云上做网站现在最流行的网站开发工具
  • 济宁网站建设联系方式漳州本地网
  • 口腔网站建设wordpress顶部提示
  • 葫芦岛做网站公司如皋网站开发公司
  • 国外开源 企业网站服务好质量好的网站制作
  • sql网站的发布流程品牌建设是什么意思
  • 营口网站建设价格江苏住房和建设厅网站
  • 网站稳定性不好的原因打金新开传奇网站
  • 做网站怎么上传图片厦门建站网址费用
  • 网站设计方案和技巧做设计有必要买素材网站会员吗
  • 成都制作网站软件网站别人帮做的要注意什么东西
  • 徐州建筑网站建网站要自己买服务器吗
  • 网站订单系统模板专业的做网站公司
  • 怎么做加盟美容院网站黄骅港开发区
  • 品牌高端网站制作官网做网站用的小图标
  • 成都网站设计合理柚v米科技泉州建设公司
  • 网页制作与网站建设完全学习手册软件下载网站怎么做
  • linux系统网站空间如何分析网站关键词
  • 以下属于网站页面设计的原则有查询网站空间商
  • 建设银行网站链接网络推广有哪些常见的推广方法
  • 常州网络公司网站图片在线制作加字
  • 漕泾网站建设建立内部网站