编辑点评:将语言模型直接引入手机的应用程序。
PocketPal AI本地大模型是一个手机上直接运行的本地AI对话工具,这个软件可以让你无需连接网络久等与其他的AI大模型进行聊天和交流,本地部署方法需要根据流程进行摸索,可以在本地增加一个最近十分热门的deepseek,这样就不会卡顿的进行使用了。

部署方法
1.百度找到精品下载
2.在精品网中搜索PocketPal,点击下载
3.打开软件点击Models,点+,点Hugging Face搜索大模型

4.尽量下载名字带Q4_NL(4bit量化 normal 压缩)的模型,回答比较精准。

5.解释一下部分量化标识命名规则:NL 平衡精度与速度(Normal)、M 中等优化(middle)、 XS 极致压缩(Extra Small)、K 极限压缩(K-special)、Qx 量化位数(手机上运行 Q4 最佳)。

6.在加载好模型后在Settings中把N PREDICT设置为4096。
如果遇到问题请发到评论区,我会试着解决。
PocketPal AI是什么软件
PocketPal AI 是一款袖珍型 AI 助手,由直接在手机上运行的小型语言模型 (SLM) 提供支持。PocketPal AI 专为 iOS 和 Android 设计,让您无需互联网连接即可与各种 SLM 进行交互。
软件特色
离线 AI 协助:直接在您的设备上运行语言模型,无需互联网连接。
模型灵活性:下载并在多个 SLM 之间进行交换,包括 Danube 2 和 3、Phi、Gemma 2 和 Qwen。
Auto Offload/Load:当应用程序在后台运行时,通过卸载模型来自动管理内存。
推理设置:自定义模型参数,如系统提示符、温度、BOS 令牌和聊天模板。
实时性能指标:在 AI 响应生成期间查看每秒令牌数和每个令牌的毫秒数。
使用流程
下载模型
点击汉堡菜单

导航到 “Models” 页面
选择您想要的型号并点击下载

加载模型
下载后,点击 Load 将模型导入内存。现在您可以聊天了!
技巧
在 iOS 设备上,Apple 的 GPU API (Metal) 默认处于激活状态。如果您遇到任何问题,请尝试停用它。
iOS 金属
自动卸载/加载
为了保持设备平稳运行,PocketPal AI 可以自动管理内存使用情况:
在模型页面上启用 “Auto Offload/Load” (默认情况下是)
该应用程序将在后台卸载模型
当您返回时,它会重新加载(对于较大的模型,请等待几秒钟)
高级设置
单击 V 形图标可访问高级 LLM 设置,例如:
温度
BOS 代币
聊天模板选项
等。

最后,让我们聊聊吧!
加载模型后,前往 “聊天” 页面并开始与加载的模型交谈!
此时还会显示 generation performance (生成性能) 指标。如果有兴趣,请观察聊天气泡以获取实时性能指标:每秒令牌数和每个令牌的毫秒数。

重要提示:截至目前,我还没有找到一种简单的方法来从生成的响应中选择和复制文本,同时保留文本格式,尤其是 Markdown 支持。
同时,以下是当前用于复制文本的选项:
段落级复制:长按特定段落可复制其内容。
完整响应复制:使用文本气泡底部的复制图标复制 AI 生成的整个响应。
我知道这些选项可能并不理想,这是我使用其他应用程序的挫败感之一。复制部分文本的困难曾经是 ChatGPT 等聊天应用程序特别烦人的方面。
开发商: PocketPal AI 是使用 React Native 构建的。找到一种平衡文本选择和保留格式(尤其是 Markdown 支持)的简单解决方案对我来说一直很棘手。如果您有这方面的经验,我很乐意听取您的意见!
更新日志
版本 v1.11.16
变化
任务/更新 e2e 测试 2 by #541
修复方法:#543 中通过基于互助的串行化防止模型切换时的内存泄漏
版本 v1.11.13
任务:升级RN 0.82,llama.rn,并在#523修复
版本 v1.11.12
专长:在#515中将llama.rn升级至0.10.0-rc.3
版本 v1.11.11
变化
修复:通过 #504 将 llama.rn 更新到 0.9.2 版本
1.11.2
feat:重构设备检查 (GPU ...) 并在 #446 中为 OpenCL 要求添加详细消息
版本 v1.10.24
壮举:通过 #413 升级 llama.rn
v1.10.22
杂务:将应用程序信息占位符图标替换为 #400
专长:在 #410 中升级 llama.rn
1.10.21
壮举:添加UI控制
版本 v1.10.19
壮举:通过 #393 升级 llama.rn
v1.10.17
壮举:在 #381 中为 PAL 添加导入/导出
[壮举]:改进中文本地化翻译 (0715) by in #373
杂务:通过 #387 升级 llama.rn
v1.10.16
壮举:在 #380 中同步 llama.rn -> llama.cpp以支持 LFM2
版本 v1.10.15
Feat: 新增思考控制
v1.10.13
修复:useChatSession 中聊天消息重复的问题
V1.10.9
Feat: 升级 llama.rn (因此llama.cpp) 以支持 GEMMA 3N by
1.10.7
壮举:通过为视觉模型添加选择退出
v1.10.0
更新 dependencys
Feat: 改进中文本地化翻译
杂务:去掉多余的 JA: '日本語 (JA)'
Feat: 通过 IN 为 Android 添加备份和恢复支持
feat: 添加 Lookie Pal
1.9.4
修复(Android):阻止 app resume 时恢复
feat: 如果 content 为空,则不渲染
修复:文本生成过程中 token 缺失/重复
1.9.0
特点: 在中为门控模型访问添加 HF 令牌身份验证
1.8.15
Feat: 添加预设补全设置
1.8.12
feat: 添加 iPad 支持 by in #249
重构:使用 IN #250 使用基于基准测试的模型改进内存需求检查
feat: 添加 Thought 标签并同步 llama.rn by in #251
修复(iPad):新增对 Upside Down Orientation 的支持 by IN #253
1.8.5
修复:改进 Android 版本跨 Edge 到 Edge Display 的实现
v1.6.9
修复:在 ChatGenerationSettingsSheet 中使用 processedSettings
1.6.7
修复(Android):删除 llama.rn 的 FP16 编译器标志以解决 Deepseek


光速虚拟机安卓正版
快手2026最新版官方正版
网易云音乐app正版
qq下载2026最新版
百度地图app手机最新版
云闪付客户端官方版
新浪微博Weibo手机版
京东商城官方客户端
阿里云盘app官方版
b站哔哩哔哩app手机版



























畅聊直播appv5.7.5 最新版
知乎第三方(Zhihu++)v0.15.7-lite 开源版
零陆零贰v1.0.2 官方版
开玩线上K歌appv1.2.9 最新版
美缘婚恋appv2.1.6.0127最新版
嘻嘻开黑appv1.0.0 最新版
落樱小屋的平行世界app(Lovin)v1.1.0 官方最新版
Steam Chat手机版v1.1 最新版
啾咪开黑v1.0.1 最新版
ocha交友v1.0.6 官方版
次元Chat AI聊天v2.1.0 官方版
MOHO社交软件v2.3.4 最新版
Uta交友软件v1.0.1 最新版
东东AI2.0.3 官方正版
纯悦免费聊天软件v1.0.1 最新版
Catalk平台v1.0.971 官方版
Agnes AI工具v2.3.35 安卓版
轻邻圈app官方正版(kkmo)v1.0.0 安卓版
幻宇星球app手机版v1.0.4 官方版
Moekey软件v1.0.0 安卓版
康娇到家app下载v1.0.3最新版
















搭子社交app大全
可以聊天的社交软件
手机dj软件
靠谱的盲盒app
影视仓软件合集
SayloAI聊天模拟中文版
布鲁帝交友软件Blued极速版
抖音豆包app官方版
COSAI对话
小红书国际版app官方正版
网易破次元恋人lofter
支持( 0 ) 盖楼(回复)
编辑回复:卡了,换个浏览器