English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
Learn about the HumanEval LLM benchmark with Empirical
已浏览 593 次
2024年4月4日
YouTube
Arjun Attam
21:24
Benchmarking LLMs: A guide to AI model evaluation | TechTarget
9 个月之前
techtarget.com
1:10
BEST AI MODEL FOR CODING : 2023-2026 (HumanEval Benchmark)
已浏览 1134 次
2 个月之前
YouTube
Learn AI / ML
11:02
LLM benchmarks
已浏览 1220 次
2024年3月24日
YouTube
Vivek Haldar
What Are LLM Benchmarks? | IBM
2024年1月29日
ibm.com
HVEval: Towards Unified Evaluation of Human-Centric Video Generatio
…
4 个月之前
acm.org
5:50
7 Popular LLM Benchmarks Explained [OpenLLM Leaderboar
…
已浏览 2.7万 次
2024年1月9日
YouTube
bycloud
16:30
Optimize Coding LLM for Reasoning or Tools?
已浏览 1937 次
8 个月之前
YouTube
Discover AI
A recognition-based motion capture baseline on the HumanEva II test
…
2011年5月25日
springer.com
1:04:18
Software Engineering and LLM Evaluation
已浏览 2 次
1 周前
YouTube
LLM Evaluation Study
19:14
Learn to Evaluate LLMs and RAG Approaches
已浏览 2.6万 次
2023年11月5日
YouTube
AI Anytime
26:19
Evaluate LLMs with Language Model Evaluation Harness
已浏览 8579 次
2024年5月12日
YouTube
AI Anytime
16:44
20.오프라인 평가와 벤치마킹 완벽 가이드
已浏览 10 次
1 个月前
YouTube
Codedeck
17:47
11.LLM 평가 태스크 완벽 가이드 | 퀴즈 10개 포함
1 个月前
YouTube
Codedeck
16:14
The NEW BEST Base LLM??? (DeepSeek LLM)
已浏览 6434 次
2023年11月29日
YouTube
1littlecoder
1:38
CodeQwen 1.5: Advanced Coding LLM with Impressive 7B Paramete
…
已浏览 13.8万 次
2024年5月3日
TikTok
techfren
0:25
🔍 Benchmarks: – Chatbot Arena (LMSYS), Hallucination tests ,Hum
…
已浏览 101 次
2 个月之前
YouTube
Hello-Wereld
3:31:24
Deep Dive into LLMs like ChatGPT
已浏览 560.7万 次
2025年2月5日
YouTube
Andrej Karpathy
20:31
Сравниваем LLM модели: как выбрать лучшую для своего пр
…
已浏览 1282 次
2025年1月22日
YouTube
ШВМ - Программы по AI и высшей математике
14:24
【LLM模型】揭开Claude 3.5 Sonnet的面纱:性能与应用
已浏览 183 次
2024年6月26日
YouTube
北美王路飞
6:28
First local LLM to Beat GPT-4 on Coding | Codellama-70B
已浏览 2.3万 次
2024年1月30日
YouTube
Prompt Engineering
1:35
humanbenchmark反应速度测试,和个人经验分享
已浏览 3.1万 次
2024年11月11日
bilibili
异托思Sensrey
4:17
MCMC-Style Sampling Boosts Base LLM Reasoning
已浏览 44 次
4 个月之前
YouTube
AI Research Roundup
6:46
【衝撃】HumanEval90%…DeepSeek V4はGPT-4を超えるのか?開発現場
…
已浏览 12 次
1 周前
YouTube
Ai Times
23:02
Evaluating Biases in LLMs using WEAT and Demographic Diversity
…
已浏览 7372 次
2023年11月5日
YouTube
AI Anytime
2:12
【humanbenchmark】人类反应测试160ms左右
已浏览 1442 次
2023年7月6日
bilibili
LOD丶丶丶
0:49
Why Most AI Code Fails in Production #ai #artificialintelligen
…
已浏览 12 次
2 个月之前
YouTube
Vyas Data Talks
4:04
GPT-OSS Evaluated: 20B vs 120B LLMs
已浏览 120 次
6 个月之前
YouTube
AI Research Roundup
7:04
【中文配音】CLLMs:一致性大语言模型 | 论文解读- AI Papers Academy
已浏览 2 次
3 周前
bilibili
程序员韩老魔
0:36
HumanBench: 以人为中心的通才模型 效果展示
已浏览 342 次
2023年4月13日
zhihu.com
OpenGVLab
观看更多视频
更多类似内容
反馈