<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Gemma on Text Matrix</title><link>https://0f9f3b1c.text-matrix.pages.dev/tags/gemma/</link><description>Recent content in Gemma on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 08 Apr 2026 11:10:11 +0800</lastBuildDate><atom:link href="https://0f9f3b1c.text-matrix.pages.dev/tags/gemma/index.xml" rel="self" type="application/rss+xml"/><item><title>LiteRT-LM：Google 生产级边缘设备 LLM 推理框架完全指南</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/litert-lm-google-edge-llm-inference-guide/</link><pubDate>Mon, 06 Apr 2026 20:00:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/litert-lm-google-edge-llm-inference-guide/</guid><description>&lt;h1 id="litert-lmgoogle-生产级边缘设备-llm-推理框架完全指南">LiteRT-LM：Google 生产级边缘设备 LLM 推理框架完全指南&lt;/h1>
&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 LiteRT-LM 的项目定位与边缘 AI 推理的技术价值&lt;/li>
&lt;li>掌握 LiteRT-LM 的核心特性、技术架构和支持的模型&lt;/li>
&lt;li>学会在 Android、iOS、Web、桌面端和 IoT 设备上部署 LLM&lt;/li>
&lt;li>掌握 LiteRT-LM 的多语言 API（Kotlin、Python、C++、Swift）&lt;/li>
&lt;li>理解 Tool Use / Function Calling 在边缘设备上的实现方式&lt;/li>
&lt;li>学会使用 LiteRT-LM CLI 进行快速原型开发和测试&lt;/li>
&lt;li>掌握从源码编译和定制优化的方法&lt;/li>
&lt;li>了解 Gemma、Llama、Phi-4、Qwen 等模型的部署实践&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>LiteRT-LM&lt;/strong> 是 Google AI Edge 推出的&lt;strong>生产级、高性能、开源边缘设备 LLM 推理框架&lt;/strong>。它专为在资源受限的边缘设备上部署大型语言模型而设计，覆盖 Android、iOS、Web、桌面端和 IoT（如树莓派）等全平台。&lt;/p></description></item><item><title>AI 新闻早报 2026-04-04</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/news/ai-news-morning-2026-04-04/</link><pubDate>Sat, 04 Apr 2026 08:00:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/news/ai-news-morning-2026-04-04/</guid><description>&lt;h1 id="ai-新闻早报--2026-04-04">AI 新闻早报 | 2026-04-04&lt;/h1>
&lt;p>🦞 每日08:00自动更新&lt;/p>
&lt;hr>
&lt;blockquote>
&lt;p>数据来源：36kr + 机器之心 + FT中文网 + Hacker News | 采集时间：2026-04-04 07:30 GMT+8&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="-头条大事件">🔥 头条大事件&lt;/h2>
&lt;p>&lt;strong>谷歌Gemma 4深夜突袭发布，31B模型击败大20倍对手&lt;/strong> &lt;a href="https://36kr.com/p/3750431179047431" target="_blank" rel="noopener noreffer ">原文&lt;/a>
谷歌于4月3日凌晨突袭发布Gemma 4开源多模态模型家族。31B参数版本性能可击败体量达其20倍的闭源模型，且支持手机端运行完整功能（&amp;ldquo;全血版&amp;rdquo;），上下文窗口最高256K，支持140+语言。业内视为谷歌在开源AI领域直接狙击阿里Qwen3.5的重磅动作。机器之心数据显示Gemma 4在开源社区引发高度关注，4月3日当天即收录为&amp;quot;值得一试&amp;quot;基座模型。
来源：36kr、机器之心&lt;/p></description></item><item><title>AI 新闻早报 2026-04-03</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/news/ai-news-morning-2026-04-03/</link><pubDate>Fri, 03 Apr 2026 08:40:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/news/ai-news-morning-2026-04-03/</guid><description>&lt;h1 id="ai-新闻早报--2026-04-03">AI 新闻早报 | 2026-04-03&lt;/h1>
&lt;p>🦞 每日08:00自动更新&lt;/p>
&lt;hr>
&lt;blockquote>
&lt;p>数据来源：36 kr AI频道 + 量子位 + Hacker News | 采集时间：2026-04-03 07:40 GMT+8&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="-大模型">🤖 大模型&lt;/h2>
&lt;p>&lt;strong>Google 发布 Gemma 4 开源模型&lt;/strong> &lt;a href="https://news.ycombinator.com/item?id=47616361" target="_blank" rel="noopener noreffer ">原文&lt;/a>
Google DeepMind 发布 Gemma 4 开源模型系列，包含多个参数规模，在多项基准测试中表现优异。该模型采用最新的架构设计，在保持开源特性的同时提升了性能表现。HN 社区 1018 点热度，315 评论。
来源：Hacker News&lt;/p></description></item></channel></rss>