Библиотеки, написанные на Cuda

instant-ngp

Мгновенные примитивы нейронной графики: молниеносный NeRF и многое другое.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

Проект является официальной реализацией нашей статьи CVPR2019 «Глубокое обучение представлению с высоким разрешением для оценки позы человека».
  • 4.1k
  • MIT

cub

Кооперативные примитивы для CUDA C++. (от NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph — библиотека графической аналитики RAPIDS.
  • 1.3k
  • Apache License 2.0

blocksparse

Эффективные ядра графического процессора для умножения и свертки матриц с разреженным блоком.
  • 948
  • MIT

k2

Алгоритмы FSA/FST, дифференцируемые, с совместимостью с PyTorch.
  • 927
  • Apache License 2.0

nv-wavenet

Эталонная реализация авторегрессионного вывода волновой сети в реальном времени.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Быстрый анализатор CSV на базе графического процессора.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Мгновенные примитивы нейронной графики: молниеносный NeRF и многое другое.
  • 458
  • GNU General Public License v3.0

nccl-tests

NCCL-тесты.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: распределенная библиотека на основе графического процессора для крупномасштабной настройки пакетов.
  • 368
  • Apache License 2.0

raft

RAFT содержит фундаментальные широко используемые алгоритмы и примитивы для науки о данных, графического и машинного обучения. (по рапидсаю).
  • 278
  • Apache License 2.0

dietgpu

Реализация GPU быстрого обобщенного энтропийного кодера и декодера ANS (асимметричная система счисления) с расширениями для сжатия без потерь числовых и других типов данных в приложениях HPC/ML.
  • 247
  • MIT

TorchPQ

Приблизительный поиск ближайшего соседа с квантованием произведения на GPU в pytorch и cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

Версия CUDA языковой модели RWKV (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Реализация CUDA алгоритма Hierarchical Navigable Small World Graph.
  • 88
  • Apache License 2.0

CUB

ЭТОТ РЕПОЗИТОРИЙ ПЕРЕЕХАЛ НА github.com/nvidia/cub, КОТОРЫЙ АВТОМАТИЧЕСКИ ЗДЕСЬ ОТОБРАЖАЕТСЯ ЗДЕСЬ..
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Сравнение языков и библиотек массивов: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC и ArrayFire..
  • 60
  • MIT

mish-cuda

Функция активации Mish для PyTorch (от JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Запускайте модель XGBoost и делайте прогнозы в Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Игровой движок, ориентированный на исследования, изучает современные методы рендеринга (от vedavamadathil).
  • 21

CryptoGPU

Анализ цен на криптовалюту.
  • 16

LSQR-CUDA

Это реализация LSQR-CUDA, написанная Лоуренсом Айерсом под руководством Стефана Гуте из института GRIS в Техническом университете Дармштадта. Библиотека LSQR была создана Крисом Пейджем и Майклом Сондерсом.
  • 11
  • MIT

SBNN

Сингулярная бинаризованная нейронная сеть, основанная на битовых операциях графического процессора (см. нашу статью SC-19).
  • 10
  • GNU General Public License v3.0

GCGT

Исходный код статьи: Обход сжатого графа на основе графического процессора.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Этот симулятор вычисляет все возможные пересечения для очень маленького временного шага для модели частиц.
  • 2

DOKSparse

разреженные DOK-тензоры на GPU, pytorch.
  • 1
  • MIT