Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

orestis-z updated a model about 1 hour ago

inference-optimization/Qwen3-8B-speculators.peagle-qwen3arch-ckpt4

orestis-z published a model about 1 hour ago

inference-optimization/Qwen3-8B-speculators.peagle-qwen3arch-ckpt4

RelaxingSnorlax updated a dataset about 1 hour ago

inference-optimization/DeepSeek-V4-Flash-responses

View all activity

Collections 6

View 6 collections

models 386

inference-optimization/Qwen3-8B-speculators.peagle-qwen3arch-ckpt4

2B • Updated about 1 hour ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-speculator.dflash

0.7B • Updated about 1 hour ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21004

2B • Updated about 2 hours ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt4

0.6B • Updated 1 day ago • 41

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step126024

2B • Updated 1 day ago • 74

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step56712

2B • Updated 4 days ago • 408

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt3

0.6B • Updated 4 days ago • 113

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

0.6B • Updated 5 days ago • 44

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

2B • Updated 6 days ago • 68

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle3-qwen3arch-ckpt1

1B • Updated 6 days ago • 10

View 386 models

datasets 25

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated about 1 hour ago • 508k

inference-optimization/every-eval-ever-demo

Updated 5 days ago • 35

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated 6 days ago • 7.47k • 68

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 12 days ago • 7.47k • 96

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 12 days ago • 7.67k • 47

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated 14 days ago • 195

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated 14 days ago • 64

inference-optimization/Qwen3-32B-responses

Preview • Updated 14 days ago • 40

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated 19 days ago • 5.61k • 34

inference-optimization/Gemma4-Responses-Nemotron

Viewer • Updated 25 days ago • 762k • 64 • 1

View 25 datasets