中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录
cac55 2025-01-13 11:14 8 浏览 0 评论
前言
以前在 github 上自己开源了一些项目。碍于技术与精力,大部分项目都是 java 实现的。
这对于非 java 开发者而言很不友好,对于不会编程的用户更加不友好。
为了让更多的人可以使用到这些简单的小工具,周末抽时间将几个开源项目添加了 web 服务实现。
开源项目
中文繁简体转换
简介:支持中文繁简体的在线转换。
在线地址:https://houbb.github.io/opensource/opencc4j/
开源地址:https://github.com/houbb/opencc4j
用法简介
此处仅选择一个作为例子介绍,其他用法大同小异。
【处理】将左边的内容,按照下拉框的选择,结果会自动填充在右边。
【互换】互换左右两边的内容。平时测试繁体=》简体,和简体=》繁体更加方便。
【复制】复制右边的内容到粘贴板。
敏感词
简介:基于 DFA 算法实现的高性能 java 敏感词工具框架。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。
在线地址:https://houbb.github.io/opensource/sensitive-word/
开源地址:https://github.com/houbb/sensitive-word
拼音
简介:高性能中文转拼音工具。支持同音字。
在线地址:https://houbb.github.io/opensource/pinyin/
开源地址:https://github.com/houbb/pinyin
可以很方便的把一段文字转换为对应的拼音,比如前言的内容默认如下:
yǐ qián zài github shàng zì jǐ kāi yuán le yī xiē xiàng mù 。 ài yú jì shù yǔ jīng lì , dà bù fèn xiàng mù dōu shì java shí xiàn de 。 zhè duì yú fēi java kāi fā zhě ér yán hěn bù yǒu hǎo , duì yú bú huì biān chéng de yòng hù gèng jiā bù yǒu hǎo 。 wèi le ràng gèng duō de rén kě yǐ shǐ yòng dào zhè xiē jiǎn dān de xiǎo gōng jù , zhōu mò chōu shí jiān jiāng jǐ gè kāi yuán xiàng mù tiān jiā le web fú wù shí xiàn 。
分词
简介:基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现。
在线地址:https://houbb.github.io/opensource/segment/
开源地址:https://github.com/houbb/segment
分词,可以说是 NLP 的基石。
前言的内容分词效果如下:
[以前[0,2), 在[2,3), [3,4), github[4,10), [10,11), 上自[11,13), 己[13,14), 开源[14,16), 了[16,17), 一些[17,19), 项目[19,21), 。[21,22), 碍于[22,24), 技术[24,26), 与[26,27), 精力[27,29), ,[29,30), 大部分[30,33), 项目[33,35), 都[35,36), 是[36,37), [37,38), java[38,42), [42,43), 实现[43,45), 的[45,46), 。[46,47), [47,48), [48,49), 这[49,50), 对于[50,52), 非[52,53), [53,54), java[54,58), [58,59), 开发者[59,62), 而言[62,64), 很[64,65), 不[65,66), 友好[66,68), ,[68,69), 对于[69,71), 不会[71,73), 编程[73,75), 的[75,76), 用户[76,78), 更加[78,80), 不[80,81), 友好[81,83), 。[83,84), [84,85), [85,86), 为了[86,88), 让[88,89), 更多[89,91), 的[91,92), 人[92,93), 可以[93,95), 使用[95,97), 到[97,98), 这些[98,100), 简单[100,102), 的[102,103), 小工[103,105), 具[105,106), ,[106,107), 周末[107,109), 抽时间[109,112), 将[112,113), 几个[113,115), 开源[115,117), 项目[117,119), 添加[119,121), 了[121,122), [122,123), web[123,126), [126,127), 服务[127,129), 实现[129,131), 。[131,132)]
汉字相似度
简介:汉字相似度计算工具。中文形近字算法
在线地址:https://houbb.github.io/opensource/nlp-hanzi-similar/
开源地址:https://github.com/houbb/nlp-hanzi-similar
markdown 目录
简介:为 markdown 文件生成 toc 目录
在线地址:https://houbb.github.io/opensource/markdown-toc/
开源地址:https://github.com/houbb/markdown-toc
个人平时的博客都是使用 markdown 编写的,专注于写作。markdown-toc 可以为这样的文本生成对应的 toc。
比如本篇文章,直接放在 github 上,是支持跳转的。
* [前言](#前言)
* [开源项目](#开源项目)
* [中文繁简体转换](#中文繁简体转换)
* [用法简介](#用法简介)
* [敏感词](#敏感词)
* [拼音](#拼音)
* [分词](#分词)
* [汉字相似度](#汉字相似度)
* [markdown 目录](#markdown-目录)
小结
这样的小工具,实现起来非常简单。
但是对于用户而言,意义还是比较大的。
最近在学习一些 AI 相关的东西,自己平时不搞 python,很多开源项目,没有 web 体验版本看起来就会很吃力。
不同的语言产生了难以逾越的鸿沟,愿你我能够借助 WEB 的力量,跨过去。
原文地址
开源项目在线化[1]
References
[1] 开源项目在线化: https://houbb.github.io/2022/11/06/opensource-tool-online
相关推荐
- 爷青回 | QQ经典老头像(爷青回这个梗出自哪里)
-
点个关注不迷路记得点击上方关注我呦点击表情包长按可保存至手机表情包素材来源于网络,仅供分享哦拿完图记得吱一声点击下方分享、在看让更多人看到...
- 史上最全QQ官方经典头像全面翻新,不光高清还会动
-
每当看到上面这些头像,总能想起那些年的"轻舞飞扬","缘分天空","追风少年",这些已经模糊的头像给我们留下了太深的印象。这次为了纪念QQ20周年,腾讯官方整合了早期的105个经典头像,进行了全面翻...
- QQ最全表情含义图解意思(qq表情含义图解最新 新版 文字)
-
QQ都不陌生吧!对QQ的表情符号含义你了解多少呢?在本文中最全图解233个表情所表达的含义,供有需人享用。用过QQ的人都晓得它的创始人是马化腾。QQ于1999年2月10日正式推出。QQ是腾讯公司开发的...
- 海联真人版QQ经典表情(海联真人版qq经典表情在哪)
-
海联版傲娇的说声“耶”狂拽炫酷就是我淑女应该轻言细语萌萌哒的娇羞哎哟喂小丫头片子机智如我吓死宝宝了欧巴卡几嘛~今天天气好晴朗怎么样?是不是很有趣呢拿起手机给自己拍几张萌萌哒的美照吧...
- QQ音乐·音乐灵感独家对话金曲奖「最佳单曲制作人奖」得主JADE
-
JADE-AllRightJADE-差-点JADE-Goodbye,GoodbyeJADE-IAmLovefeat.乔瑟夫Chillseph下面请听本期灵感电台节目:本期博客...
- 亿万富豪爱泼斯坦狱中“自杀”,他背后的神秘女人出现在洛杉矶快餐店
-
爱泼斯坦在狱中离奇“自杀”,但他身负同谋指控的前女友、英国社交名媛希莱恩·麦克斯维尔(GhislaineMaxwell),却意外地出现在了洛杉矶街头平民快餐店,边啃着汉堡,咽着薯条,嘬着奶昔,边埋头...
- 扛起星战大旗的你们 觉得星战女需要换一身衣裳吗?
-
马上进入2016年,除了各种总结盘点以外,2016年的新看点也是需要科普一下了。目前最令人期待的应该就是《星球大战》回归了!《StarWars:原力觉醒》1月10日上映,博主不是电影评论员,所以不会...
- 和人对话的时候,我,最怕的就是,看到了自己内心的惶恐和脆弱
-
IWannaBeYourSlave(LiveFromGlobalCitizenLive2021),Maneskin很多时候,哪怕最甘于寂寞的人,也需要和人发生关联,需要和这个世界沟...
- 2024年度串烧完整版(搞笑失败尴尬丢人版)来了
-
一首APT的时间带你回顾你的2024年年度歌单。·1.《免我蹉跎苦》黄龄。·2.《红昭愿》音阙诗听。·3.《苹果香》狼戈。·4.《免我蹉跎苦》黄龄。·5.《红昭愿》音阙诗听。·6.《苹果香》狼戈。·7...
- 一课译词:打工人(打工人的翻译)
-
下午好,各位打工人!近日,“打工人”爆红网络,受到各行各业年轻人的追捧,但这词到底说的是个啥?“打工人”是那些依靠体力或技术的劳动者的统称。除了赚钱这个最大的目标,别的啥也不想;他们意志坚定,也不会迟...
- 初级词汇题(一)柏拉图指出不是每个孩子都适合上学,你赞成吗?
-
初级词汇题(一)柏拉图在《理想国》中指出不是每个孩子都适合上学,你赞成吗?今天分享的题目是我基于英文原著改编的初级词汇题A开头的第81道题。背景知识拓展:什么是nativist(先天论者)?什么是哲学...
- 治愈系英文:每个说不想恋爱的人,心里都装着一个无法拥有的人
-
Therearesomanypeopleouttherewhowilltellyouthatyoucan't.Whatyou'vegottodoisturna...
- 首首经典!意大利流行乐队Maneskin作品I WANNA BE YOUR SLAVE
-
手机点击试听(上边)Maneskin是一支来自罗马的意大利流行摇滚乐队,由主唱DamianoDavid、贝斯手VictoriaDeAngelis、吉他手ThomasRaggi和鼓手...
- 国家电网新一代电子商务平台投标文件双层PDF制作最全教程
-
投标知识在招投标过程中,我们经常碰见有些文件要求制成双层PDF格式,那么双层PDF是什么呢?怎么制作呢?今天就给大家普及下。定义双层PDF双层PDF格式文件是一种具有多层结构的PDF格式文件,是PD...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- 如何绘制折线图 (52)
- javaabstract (48)
- 新浪微博头像 (53)
- grub4dos (66)
- s扫描器 (51)
- httpfile dll (48)
- ps实例教程 (55)
- taskmgr (51)
- s spline (61)
- vnc远程控制 (47)
- 数据丢失 (47)
- wbem (57)
- flac文件 (72)
- 网页制作基础教程 (53)
- 镜像文件刻录 (61)
- ug5 0软件免费下载 (78)
- debian下载 (53)
- ubuntu10 04 (60)
- web qq登录 (59)
- 笔记本变成无线路由 (52)
- flash player 11 4 (50)
- 右键菜单清理 (78)
- cuteftp 注册码 (57)
- ospf协议 (53)
- ms17 010 下载 (60)