### OpenAI概述 OpenAI API 可应用于几乎任何需要理解或生成自然语言或代码的任务。为我们提供一系列不同能力水平的模型,适用于不同的任务,并具有微调自定义模型的能力。这些模型可用于从内容生成到语义搜索和分类等各种任务。 **提示和完成** 完成端点是 API 的核心。它提供了一个极其灵活和强大的模型接口。我们可以将一些文本作为提示输入,模型将生成一个文本完成,试图匹配我们给出的上下文或模式。例如,如果我们给 API 提供提示“为一个冰淇淋店写一个标语”,它将返回类似“我们每勺都带来微笑!”的完成语。 <br> 设计我们的提示实际上就是如何“编程”模型,通常是通过提供一些说明或几个示例来完成。这与大多数其他 NLP 服务不同,它们设计用于单个任务,例如情感分类或命名实体识别。相反,完成端点可用于几乎任何任务,包括内容或代码生成、摘要、扩展、对话、创意写作、风格转移等。 **令牌-Tokens** 模型通过将文本分解为令牌来理解和处理文本。令牌可以是单词,也可以是字符块。例如,“hamburger ”这个词会被分解为“ham”、“bur”和“ger”这些令牌,而“pear ”这样的短而常见的词是一个单独的令牌。许多令牌以空格开头,例如“ hello”和“ bye”。 <br> 在给定的 API 请求中处理的令牌数量取决于我们的输入和输出的长度。作为一个粗略的经验法则,1 个令牌大约相当于 4 个字符或英文文本的 0.75 个单词。要记住的一个限制是,您的文本提示和生成的完成语组合的长度必须不超过模型的最大上下文长度(对于大多数模型,这是 2048 个令牌,约 1500 个单词)。 <br> 我们可以把令版(token)理解为类似于搜索引擎为我们查找结果时的分词效果,比如,你今天很漂亮:通常会为我们分成 “你” “今天” “很” “漂亮” 这种场景。 <br> 同时,openapi为我们提供了一个分词演示界面,可以帮助我们理解它的token分词效果,该工具地址为: [https://platform.openai.com/tokenizer](https://platform.openai.com/tokenizer) ![](https://img.kancloud.cn/58/4c/584c8f07cfb04e5909fb5bfdd0f4fb29_1466x848.png =600x300) 可以看到,它帮我们分成了4个词,或者也可以称为4个token。 **模型** API 由一组具有不同能力和价格点的模型驱动。基础 GPT-3 模型称为 Davinci、Curie、Babbage 和 Ada。Codex系列是GPT-3的后代,经过训练可以处理自然语言和代码。这使得它在生成或理解代码方面表现出色,例如自动完成代码片段或根据自然语言提示编写整个程序。Codex还具有理解和理解编程语言结构和语法的能力,使其成为软件开发的强大工具。 **API密钥和访问** 要使用OpenAI API,需要获取API密钥。在获得API密钥后,我们可以使用curl、Python、JavaScript等多种方式访问API。还可以使用官方为我们提供的开发者库和SDK。 **API调用和定价** chatGPT的API根据使用的模型和返回结果的数量进行定价。由于模型使用的计算资源非常大,因此API调用可能会产生高额的计算成本。官方目前提供了免费试用期和多种定价选项,以便在不超过预算的情况下探索和使用API。 **小结:** OpenAI API是一个功能强大、灵活且易于使用的自然语言处理和代码生成工具。我们的多个模型可以适用于各种任务,并提供了可定制的能力,以便我们可以根据自己的需求调整和微调模型。