Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization.

AllImages Books Shopping Maps Videos News

Tender: Accelerating Large Language Models via Tensor Decomposition ...

Jun 16, 2024 · In this paper, we present Tender, an algorithm-hardware co-design solution that enables efficient deployment of LLM inference at low precision.

Tender: Accelerating Large Language Models via Tensor Decomposition ...

www.computer.org › csdl › isca

In this paper, we present Tender, an algorithm-hardware co-design solution that enables efficient deployment of LLM inference at low precision.

Tender: Accelerating Large Language Models via Tensor Decomposition ...

arxiv.org › html

Jun 16, 2024 · In this paper, we present Tender, an algorithm-hardware co-design solution that enables efficient deployment of LLM inference at low precision.

Tender: Accelerating Large Language Models via Tensor ... - GitHub

github.com › snu-comparch › Tender

In this paper, we present Tender, an algorithm-hardware co-design solution that enables efficient deployment of LLM inference at low precision.

[PDF] Tender: Accelerating Large Language - Models via Tensor Decomposition ...

jungi-lee.github.io › assets › pdf › i...

Tender. Accelerating Large Language. Models via Tensor Decomposition. And Runtime Requantization. Jungi Lee ([email protected]). Thank You! ISCA-51 | July ...

Tender: Accelerating Large Language Models via Tensor Decomposition ...

www.aimodels.fyi › papers › arxiv › ten...

Jun 20, 2024 · The "Tender" paper introduces two innovative techniques, tensor decomposition and runtime requantization, to significantly accelerate the inference of large ...

Wonbeom Lee

leewonbeom.github.io

Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization. Jungi Lee*, Wonbeom Lee*, Jaewoong Sim. ISCA, June 2024. [paper] ...

Papers with Code - Wonbeom Lee

paperswithcode.com › author › wonbeo...

Jun 28, 2024 · Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization · no code implementations • 16 Jun 2024 • Jungi ...

pvti/Awesome-Tensor-Decomposition - GitHub

github.com › pvti › Awesome-Tensor-De...

Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization · GitHub Repo stars, ISCA, 2024. Unified Low-rank Compression ...

Tensor Decomposition - Papers With Code

paperswithcode.com › task › codeless

Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization. no code yet • 16 Jun 2024. Large language models (LLMs) ...