NVIDIA TensorRT-LLMとDatabricks推論スタックを統合するDecember 21, 2023 リンデン・リー、メーガ・アガルワル、Kobie Crawford、ダヤ・クディア による投稿 in モザイクリサーチ この半年間、私たちはNVIDIAと 協力して、彼らの新しいTensorRT-LLMライブラリを最大限に活用してきました。 TensorRT-LLMは、ウェブサーバと統合するための使いやすいPythonインタフェースを提供し、LLMによる高速で効率的な推論パフォーマンスを実現します。 この投稿では、NVIDIAとの協力が特に重要であった主要分野をいくつか紹介します。