Go使用Google Gemini Pro API创建简单聊天机器人
目录
gemini go sdk实现命令行聊天机器人
最近Google 如期发布Gemini Pro API,目前为免费使用,Go的SDK也已经在github上发布了
具体地址见:https://github.com/google/generative-ai-go
本文将通过最新的gemini go sdk来实现命令行聊天机器人。
Go语言实现监听键盘输入
reader := bufio.NewReader(os.Stdin)
// 读取输入直到遇到第一个换行符
input, err := reader.ReadString('
')
reader对象的ReadString方法即可实现我们需要的监听键盘的方法,这里设置为当监听到回车输入的时候,则读取用户输入的内容。
整合Gemini SDK
前提条件
安装SDK
go get github.com/google/generative-ai-go
实例化一个gemini Client
func getGeminiClient() *genai.Client {
ctx := context.Background()
client, err := genai.NewClient(ctx, option.WithAPIKey("YOUR-API-KEY"))
if err != nil {
log.Fatal(err)
}
return client
}
根据用户输入向gemini 服务器发请求。
func handleChat(ctx context.Context, client *genai.Client, cs *genai.ChatSession, content string) error {
if cs == nil {
return errors.New("chat session is nil")
}
return geminiPro(ctx, cs, content)
}
func geminiPro(ctx context.Context, cs *genai.ChatSession, content string) error {
prompt := genai.Text(content)
iter := cs.SendMessageStream(ctx, prompt)
fmt.Print("[Gemini]:")
for {
resp, err := iter.Next()
if err == iterator.Done {
break
}
if err != nil {
fmt.Print("Something wrong, please try again later.
")
return err
}
printChatResponse(resp)
}
return nil
}
func printChatResponse(resp *genai.GenerateContentResponse) {
for _, c := range resp.Candidates {
for _, p := range c.Content.Parts {
fmt.Printf("%v", p)
}
}
fmt.Println()
}
这里就是整个Gemini SDK调用的核心代码了,每次使用ChatSession对象(geminiPro方法中的cs变量)发送消息,这里使用的的是流式子消息传输,所以,在geminiPro方法里面,需要启动一个for循环,等待消息的全部输出。
我们整个会话使用的都是同一个ChatSession对象,并且,在发送消息之后,内容会自动加到ChatSession对象的History里面,History也就是历史会话,Gemini SDK一样可以根据上下文来实现问答的实现。
如何实现ChatSession只实例化一次
前面已经说过,一个会话需要使用同一个ChatSession对象,我们自然而然就想到Go里面的sync.Once对象,但在使用Gemini Go SDK的过程中发现,经常会遇到请求出错的情况,一旦请求出错,就需要重新去创建一个会话对象,所以,Go语言提供的sync.Once并不能满足这个需求,所以,需要自己实现一个可以重置的Once对象,这里命名为ResetOnce对象,代码如下:
// ResettableOnce 结构体包含一个互斥锁和一个标记是否已执行的布尔值
type ResettableOnce struct {
m sync.Mutex
done bool
}
// Do 方法类似于 sync.Once 的 Do,但可以通过调用 Reset 来重置
func (o *ResettableOnce) Do(f func()) {
o.m.Lock()
defer o.m.Unlock()
if !o.done {
defer func() { o.done = true }()
f()
}
}
// Reset 方法重置 Once,允许再次调用 Do
func (o *ResettableOnce) Reset() {
o.m.Lock()
defer o.m.Unlock()
o.done = false
}
如何实现用户ChatSession重新创建之后,保持之前的History?
在实际的项目中,我们肯定会对History做持久化,但这里这里,仅使用一个全局的history来模拟持久化。
当ChatSession对象被新建之后,需要将全局history的内容复制给新创建的ChatSession对象,这里为了模拟这个过程,在用户输入内容的时候,添加一个检测内容是否为reset字符串的操作,当检测用户输入为reset字符串的时候,则主动新建一个ChatSession,同时将新的ChatSession的History赋值为之前的history内容,这样即使新建立一个ChatSession它还能保持之前的会话记录。
代码如下:
func handleReset(client *genai.Client, cs **genai.ChatSession, history *[]*genai.Content) {
fmt.Println("[System]", "Resetting chat session.")
once.Reset()
once.Do(func() {
*cs = startChatSession(client, *history)
})
}
func startChatSession(client *genai.Client, history []*genai.Content) *genai.ChatSession {
model := client.GenerativeModel("gemini-pro")
cs := model.StartChat()
if len(history) > 0 {
cs.History = history
}
return cs
}
总结
如果在实际中使用这个SDK进行商业化开发,那么比如需要处理用户多会话的管理,其实这个过程也不麻烦,只要维护好用户以及它对应的history的关系,在用户每次开始登录进入系统,并且选择会话的时候,将对应的history给设好即可。但要注意的是,目前pro版本支持的最大的32K的上下文。另外SDK中还提供了模型的使用,你们有兴趣的可以自己去探索。
以上就是Go使用Google Gemini Pro API创建简单聊天机器人的详细内容,更多关于go创建聊天机器人的资料请关注脚本之家其它相关文章!
您可能感兴趣的文章: