#Github #开源 #工具 做爬虫或者数据采集,有时候只是想快速抓个网页数据,却要写一堆代码处理 HTML、JSON,还得考虑翻页逻辑,挺费劲。
偶然看到 Pipet 这个命令行爬虫工具,用类似写配置文件的方式描述数据结构,就能自动抓取网页内容。
支持三种工作模式:HTML 解析、JSON 解析和 JavaScript 执行,通过缩进来定义数据层级,还能直接用 Unix 管道扩展功能。
https://github.com/0xSojalSec/pipet
比如想抓 Hacker News 的标题和链接,只需要写几行 CSS 选择器,Pipet 就能自动提取并按你定义的结构输出。
还支持自动翻页,只要指定 “下一页”的选择器,它就会自动跟随链接继续抓取。
另外还提供了监控模式,设置轮询间隔,数据变化时自动执行指定命令,可以用来监控价格变动、票务上新这类场景。
提供了开箱即用的二进制包,也支持通过 Go 直接编译安装。
via Memos
偶然看到 Pipet 这个命令行爬虫工具,用类似写配置文件的方式描述数据结构,就能自动抓取网页内容。
支持三种工作模式:HTML 解析、JSON 解析和 JavaScript 执行,通过缩进来定义数据层级,还能直接用 Unix 管道扩展功能。
https://github.com/0xSojalSec/pipet
比如想抓 Hacker News 的标题和链接,只需要写几行 CSS 选择器,Pipet 就能自动提取并按你定义的结构输出。
还支持自动翻页,只要指定 “下一页”的选择器,它就会自动跟随链接继续抓取。
另外还提供了监控模式,设置轮询间隔,数据变化时自动执行指定命令,可以用来监控价格变动、票务上新这类场景。
提供了开箱即用的二进制包,也支持通过 Go 直接编译安装。
via Memos
#GitHub #开源 获取你所有的星标仓库,并将它们的 README 文件保存为 Markdown 格式。
功能特点
● 自动获取所有星标仓库信息
● 将 README 文件转换并保存为 Markdown 格式
● 保留仓库的基本信息(项目名、星标数、描述等)
● 每周自动运行备份(通过 GitHub Actions)
● 支持 HTML 到 Markdown 的智能转换
● 包含错误处理和重试机制
https://github.com/princemaple/github-stars
via Memos
功能特点
● 自动获取所有星标仓库信息
● 将 README 文件转换并保存为 Markdown 格式
● 保留仓库的基本信息(项目名、星标数、描述等)
● 每周自动运行备份(通过 GitHub Actions)
● 支持 HTML 到 Markdown 的智能转换
● 包含错误处理和重试机制
https://github.com/princemaple/github-stars
via Memos
#Docker #GitHub 一个轻量级、智能的 Docker 镜像加速与代理管理工具。它提供了一个现代化的 Web UI,用于管理上游镜像源,支持自动测速、延迟择优、流量统计以及一键获取免费代理节点。旨在解决国内拉取 Docker 镜像慢、超时等问题。
https://github.com/xingfeng7788/docker-hub-proxy
via Memos
https://github.com/xingfeng7788/docker-hub-proxy
via Memos
#开源 #GitHub 发现一款超好用的部署神器:PinMe,用一行命令,即可在几秒内上线各种前端应用!
搭配上 Gemini 3 来使用,体验无比丝滑。
用 AI 产出的各种 Demo、个人网站、落地页介绍,都可以丢到上面,生成可永久访问的链接。
PinMe 部署过程非常简单:
通过官网或命令行工具一键上传,适配新手小白到开发高手的使用习惯。
部署过程中,无需用到任何服务器、域名配置,真正做到了开箱即用。
除此之外,它还具备以下功能:
● 全球高速:分布式 IPFS 节点,实现全球快速访问;
● 访问安全:每个页面具有唯一的 CID,确保内容不可篡改、可永久验证。
https://github.com/glitternetwork/pinme
via Memos
搭配上 Gemini 3 来使用,体验无比丝滑。
用 AI 产出的各种 Demo、个人网站、落地页介绍,都可以丢到上面,生成可永久访问的链接。
PinMe 部署过程非常简单:
通过官网或命令行工具一键上传,适配新手小白到开发高手的使用习惯。
部署过程中,无需用到任何服务器、域名配置,真正做到了开箱即用。
除此之外,它还具备以下功能:
● 全球高速:分布式 IPFS 节点,实现全球快速访问;
● 访问安全:每个页面具有唯一的 CID,确保内容不可篡改、可永久验证。
https://github.com/glitternetwork/pinme
via Memos
#工具 #AI #链接 最近不少人被 Google AI Studio 一段提示词就能生成网页应用惊讶到了。其实还有一个叫做 Loveble 的应用做的更好,并给可以直接给你个域名部署上线,非常适合产品经理、UI 设计师等需要构建最小可用版本的人员使用。
还有一些很有意思的特性:
1. 支持一键接入各类 llm 模型;
2. 支持快速修改系统主题色和 UI 元素;
3. 支持在线监控生成的 AI 应用使用情况。
点击使用 https://lovable.dev
via Memos
还有一些很有意思的特性:
1. 支持一键接入各类 llm 模型;
2. 支持快速修改系统主题色和 UI 元素;
3. 支持在线监控生成的 AI 应用使用情况。
点击使用 https://lovable.dev
via Memos
#Github #工具 #网络资源 近 7000 个 N8N 工作流模板
一位老哥把官方 n8n . io/workflows 网站上所有的公开工作流都扒下来做成的一个独立的、可版本化的离线归档。
不用担心官方网站哪天抽风或者删掉你喜欢的工作流了,所有东西都在这个代码仓库里,你可以随时下载下来用。
https://github.com/nusquama/n8nworkflows.xyz
via Memos
一位老哥把官方 n8n . io/workflows 网站上所有的公开工作流都扒下来做成的一个独立的、可版本化的离线归档。
不用担心官方网站哪天抽风或者删掉你喜欢的工作流了,所有东西都在这个代码仓库里,你可以随时下载下来用。
https://github.com/nusquama/n8nworkflows.xyz
via Memos
#Github #工具 #网络资源
阅读国外专业的学术论文,光理解内容就挺费劲了,如果还要总结内容、生成思维导图,更是让人头疼。
可以试下,Paper Burner X 这个开源工具,集文献识别、翻译、阅读与智能分析于一体,在浏览器上打开就能用。
一个纯前端实现的 Agent 智能分析系统,可自主调用工具进行多步推理,还能翻译长论文,保留公式、图表等复杂格式。
主要功能:
● 支持 PDF、Word、PPT、EPUB 等多种格式导入和处理;
● 极速并发翻译,长论文仅需数十秒,保留原文格式;
● 前端 Agent 智能分析,支持复杂问答和信息提取;
● 自动生成思维导图、流程图和结构化文献矩阵;
● 原译文智能对齐对比,支持高亮标注和目录导航。
直接访问在线版或部署到 Vercel 即可使用,所有数据存储在本地,保护隐私的同时无需安装任何软件。
https://github.com/Feather-2/paper-burner-x
via Memos
阅读国外专业的学术论文,光理解内容就挺费劲了,如果还要总结内容、生成思维导图,更是让人头疼。
可以试下,Paper Burner X 这个开源工具,集文献识别、翻译、阅读与智能分析于一体,在浏览器上打开就能用。
一个纯前端实现的 Agent 智能分析系统,可自主调用工具进行多步推理,还能翻译长论文,保留公式、图表等复杂格式。
主要功能:
● 支持 PDF、Word、PPT、EPUB 等多种格式导入和处理;
● 极速并发翻译,长论文仅需数十秒,保留原文格式;
● 前端 Agent 智能分析,支持复杂问答和信息提取;
● 自动生成思维导图、流程图和结构化文献矩阵;
● 原译文智能对齐对比,支持高亮标注和目录导航。
直接访问在线版或部署到 Vercel 即可使用,所有数据存储在本地,保护隐私的同时无需安装任何软件。
https://github.com/Feather-2/paper-burner-x
via Memos
#Github #工具 做数据分析的人应该都懂那种崩溃感:
Excel 一开就卡、SQL 跑半天、模型调参像瞎猜、报告一写就是一下午。
更别说很多人本职工作也不是“数据科学家”,但又不得不啃一堆 CSV、报表和图表。
这两天看到人民大学 RUC Datalab 开源的DeepAnalyze,有点眼前一亮。
https://github.com/ruc-datalab/DeepAnalyze
它不是那种“帮你写点分析文案”的 AI,而是想做一个真正的「AI 数据分析师」:
能读 Excel/CSV/JSON/TXT,自己规划步骤、清洗数据、建模、画图、最后给你一份完整报告。
甚至还能把推理链(reasoning trace)展示出来,让你看到它是怎么一步步想出来的。
我自己最有感觉的点有几个:
以前 ChatGPT 更像“写稿子、写代码”的助手,但对数据本身不够“懂”;
DeepAnalyze 直接把这一块补上了,做到“从数据到报告”的全流程;
对普通人来说,可能第一次有机会把“专业的数据分析能力”当成一个工具来用,而不是一门必须自己啃几年的技能。
当然,它现在肯定还不完美,落地也需要折腾环境、准备数据。
但这个方向我很看好:
AI 帮你做繁琐的统计和建模,人类负责问好问题、选好指标、做最后决策。
数据分析不再是少数人的特权,而是变成人人可用的一种“智能能力”。
简单说:
过去是「你学会数据分析再去用工具」,
以后可能是「你先有一个 AI 数据分析师,再慢慢学会怎么问对问题」。
via Memos
Excel 一开就卡、SQL 跑半天、模型调参像瞎猜、报告一写就是一下午。
更别说很多人本职工作也不是“数据科学家”,但又不得不啃一堆 CSV、报表和图表。
这两天看到人民大学 RUC Datalab 开源的DeepAnalyze,有点眼前一亮。
https://github.com/ruc-datalab/DeepAnalyze
它不是那种“帮你写点分析文案”的 AI,而是想做一个真正的「AI 数据分析师」:
能读 Excel/CSV/JSON/TXT,自己规划步骤、清洗数据、建模、画图、最后给你一份完整报告。
甚至还能把推理链(reasoning trace)展示出来,让你看到它是怎么一步步想出来的。
我自己最有感觉的点有几个:
以前 ChatGPT 更像“写稿子、写代码”的助手,但对数据本身不够“懂”;
DeepAnalyze 直接把这一块补上了,做到“从数据到报告”的全流程;
对普通人来说,可能第一次有机会把“专业的数据分析能力”当成一个工具来用,而不是一门必须自己啃几年的技能。
当然,它现在肯定还不完美,落地也需要折腾环境、准备数据。
但这个方向我很看好:
AI 帮你做繁琐的统计和建模,人类负责问好问题、选好指标、做最后决策。
数据分析不再是少数人的特权,而是变成人人可用的一种“智能能力”。
简单说:
过去是「你学会数据分析再去用工具」,
以后可能是「你先有一个 AI 数据分析师,再慢慢学会怎么问对问题」。
via Memos
#Github #链接 #网络资源 GitHub 上 Awesome Health 这份精心整理的资源合集,为我们提供了一份高质量的医疗领域开源项目清单。
覆盖了各个方面,从电子病历系统到医学影像处理,从远程医疗到机器学习,每个项目都经过精心筛选。
https://github.com/kakoni/awesomehealth
主要内容:
● 电子病历系统(EHR):包含 OpenMRS、Bahmni、HospitalRun 等 20+ 个开源系统;
● 医学影像处理:涵盖 DICOM 服务器、图像查看器、3D 可视化等工具;
● 开发框架和库:提供 FHIR、HL7 等标准的实现库,支持多种编程语言;
● 医疗数据标准:整理了 FHIR、HL7、DICOM 等核心标准规范;
● 机器学习工具:收录专门用于医疗健康的 AI 工具和数据集;
● 医疗物流管理:包含供应链、资产管理等实用系统。
适合医疗软件开发者、医院 IT 人员和医疗研究人员,可以快速找到所需的开源解决方案。
via Memos
覆盖了各个方面,从电子病历系统到医学影像处理,从远程医疗到机器学习,每个项目都经过精心筛选。
https://github.com/kakoni/awesomehealth
主要内容:
● 电子病历系统(EHR):包含 OpenMRS、Bahmni、HospitalRun 等 20+ 个开源系统;
● 医学影像处理:涵盖 DICOM 服务器、图像查看器、3D 可视化等工具;
● 开发框架和库:提供 FHIR、HL7 等标准的实现库,支持多种编程语言;
● 医疗数据标准:整理了 FHIR、HL7、DICOM 等核心标准规范;
● 机器学习工具:收录专门用于医疗健康的 AI 工具和数据集;
● 医疗物流管理:包含供应链、资产管理等实用系统。
适合医疗软件开发者、医院 IT 人员和医疗研究人员,可以快速找到所需的开源解决方案。
via Memos
#Github
#工具 写技术文档时,我们常用 Markdown 格式记录,但想把这些文档发布成网站却挺麻烦,现有工具要么配置复杂,要么生成的网站加载很慢。
在 GitHub 上看到 docmd 这个开源工具,它能将我们的 Markdown 文件快速转换成美观的静态文档网站,真正做到零配置、开箱即用!
基于 Node.js 开发,只需三个简单命令就能完成从初始化到部署的全过程,生成的网站轻量且快速。
而且支持多种主题、语法高亮和深色模式,还提供提示框、卡片、步骤等组件,也可以自定义页面内容。
GitHub:github.com/mgks/docmd
除此之外,还内置了 SEO、Analytics 和 Sitemap 插件,可以用来优化网站的体验。
通过 npm 全局安装后即可使用,生成的静态网站可部署到 GitHub Pages、Vercel 等任意平台。
via Memos
#工具 写技术文档时,我们常用 Markdown 格式记录,但想把这些文档发布成网站却挺麻烦,现有工具要么配置复杂,要么生成的网站加载很慢。
在 GitHub 上看到 docmd 这个开源工具,它能将我们的 Markdown 文件快速转换成美观的静态文档网站,真正做到零配置、开箱即用!
基于 Node.js 开发,只需三个简单命令就能完成从初始化到部署的全过程,生成的网站轻量且快速。
而且支持多种主题、语法高亮和深色模式,还提供提示框、卡片、步骤等组件,也可以自定义页面内容。
GitHub:github.com/mgks/docmd
除此之外,还内置了 SEO、Analytics 和 Sitemap 插件,可以用来优化网站的体验。
通过 npm 全局安装后即可使用,生成的静态网站可部署到 GitHub Pages、Vercel 等任意平台。
via Memos
#开源 #Github #工具
snapDOM:快速精准的网页截图神器
snapDOM 能快速且精确地将网页上的任何 HTML 元素截取为高质量、可缩放的 SVG 图片,完全保留原始元素的样式、字体、背景图片、伪元素(pseudo-elements)甚至是 Shadow DOM(一种封装于DOM元素内部的独立DOM结构,用于组件隔离和样式保护)。此外,它还能轻松导出为各种常见的位图格式和 canvas。
项目地址:https://github.com/zumerlab/snapdom
演示地址:https://snapdom.dev
via Memos
snapDOM:快速精准的网页截图神器
snapDOM 能快速且精确地将网页上的任何 HTML 元素截取为高质量、可缩放的 SVG 图片,完全保留原始元素的样式、字体、背景图片、伪元素(pseudo-elements)甚至是 Shadow DOM(一种封装于DOM元素内部的独立DOM结构,用于组件隔离和样式保护)。此外,它还能轻松导出为各种常见的位图格式和 canvas。
项目地址:https://github.com/zumerlab/snapdom
演示地址:https://snapdom.dev
via Memos
#工具 #链接 #网络资源 这是一个收录了 多个平台 Emoji 的聚合网站,包括:
● 🪟 微软 Fluent Emoji ( 3D 风格)
● 🐧 Google Noto Emoji
● 🐙 系统 Emoji (Unicode)
你可以:
● 按分类或关键词搜索 Emoji 🔍
● 查看不同平台的设计对比
● 一键下载 PNG / SVG 格式(无需登录)
https://emojidir.com
via Memos
● 🪟 微软 Fluent Emoji ( 3D 风格)
● 🐧 Google Noto Emoji
● 🐙 系统 Emoji (Unicode)
你可以:
● 按分类或关键词搜索 Emoji 🔍
● 查看不同平台的设计对比
● 一键下载 PNG / SVG 格式(无需登录)
https://emojidir.com
via Memos
#链接 #游戏 发现个很赞的网站:https://buildcores.com
居然是网页版的电脑装机模拟器,交互做的很不错,细节很丰富,一不小心下午一行代码没写,玩了两个小时,太专业了,目前市场上各种最新的配件都有,还有真实的购买链接,还有各种数据,还可以分享。
强烈推荐给各位装机爱好者
via Memos
居然是网页版的电脑装机模拟器,交互做的很不错,细节很丰富,一不小心下午一行代码没写,玩了两个小时,太专业了,目前市场上各种最新的配件都有,还有真实的购买链接,还有各种数据,还可以分享。
强烈推荐给各位装机爱好者
via Memos
#Github #开源 #工具 Bruno 是一款全新且创新的 API 客户端,旨在颠覆 Postman 和其他类似工具。
Bruno 直接在您的电脑文件夹中存储您的 API 信息。我们使用纯文本标记语言 Bru 来保存有关 API 的信息。
您可以使用 Git 或您选择的任何版本控制系统来对您的 API 信息进行版本控制和协作。
Bruno 仅限离线使用。我们计划永不向 Bruno 添加云同步功能。我们重视您的数据隐私,并认为它应该留在您的设备上。
https://github.com/usebruno/bruno
via Memos
Bruno 直接在您的电脑文件夹中存储您的 API 信息。我们使用纯文本标记语言 Bru 来保存有关 API 的信息。
您可以使用 Git 或您选择的任何版本控制系统来对您的 API 信息进行版本控制和协作。
Bruno 仅限离线使用。我们计划永不向 Bruno 添加云同步功能。我们重视您的数据隐私,并认为它应该留在您的设备上。
https://github.com/usebruno/bruno
via Memos
#Github #开源 #工程师工具
PatchMon 面向 Linux 服务器环境的补丁管理自动化平台,提供集中统一的补丁管理和安全自动化。
https://github.com/PatchMon/PatchMon
via Memos
PatchMon 面向 Linux 服务器环境的补丁管理自动化平台,提供集中统一的补丁管理和安全自动化。
https://github.com/PatchMon/PatchMon
via Memos
zhcn.xyz (Twitter)
#名人名言 人生是一段旅途,这句话听起来有点老生常谈。但它真正的意味在于:旅途分阶段,也有不同的站台。到一个站时,你可能还没准备好,也可能不愿接受,但时间和列车不会等你。能做的,就是坦然地下车,开始新的状态。
#名人名言 人生是一段旅途,这句话听起来有点老生常谈。但它真正的意味在于:旅途分阶段,也有不同的站台。到一个站时,你可能还没准备好,也可能不愿接受,但时间和列车不会等你。能做的,就是坦然地下车,开始新的状态。
zhcn.xyz (Twitter)
Helium Mobile 目前提供的零元套餐完全免费,包含税费。零元套餐每个账单周期内包含:
•3GB 蜂窝数据
•100 分钟语音通话
•300 条短信(收发均计)
超出部分可通过 Helium Mobile App 中的“附加服务(Add Ons)”购买,价格为每 GB 7.50 美元。若不购买附加服务,则无需绑定信用卡。
Helium Mobile 目前提供的零元套餐完全免费,包含税费。零元套餐每个账单周期内包含:
•3GB 蜂窝数据
•100 分钟语音通话
•300 条短信(收发均计)
超出部分可通过 Helium Mobile App 中的“附加服务(Add Ons)”购买,价格为每 GB 7.50 美元。若不购买附加服务,则无需绑定信用卡。
zhcn.xyz (Twitter)
Helium Mobile新政策
所有零元套餐用户必须在每个账单周期(30 天内)有实际的蜂窝数据使用。如未在周期内使用,将在当前账期结束后终止零元套餐。
此外,零元套餐用户必须保持持续的蜂窝网络活跃使用,才能有资格赚取和兑换 Cloud Points(云积分)。
Helium Mobile新政策
所有零元套餐用户必须在每个账单周期(30 天内)有实际的蜂窝数据使用。如未在周期内使用,将在当前账期结束后终止零元套餐。
此外,零元套餐用户必须保持持续的蜂窝网络活跃使用,才能有资格赚取和兑换 Cloud Points(云积分)。