LoongMMI

LoongMMILoongMultiMedia extensions Instruction,简称MMI)指令集龙芯多媒体扩展指令集,是LoongISA指令集架构的一个扩展指令集[1]。LoongMMI部分指令是128的,故LoongMMI是128位多媒体向量指令集[來源請求]。LoongMMI指令集拓展对标英特尔的MMX SIMD多媒体指令集龙芯中科在其龙芯2F中央处理器中首次添加LoongMMI指令集拓展[1],在其龙芯3A1000中央处理器中首次添加LoongISA版本的LoongMMI[2]。LoongMMI指令集提供了80条指令[2],是龙芯64位通用架构长期支持的指令集拓展。

历史

LoongMMI在龙芯2F发布时第一次公开露面,在2F时代及其以后很长一段时间内被称为LoongSIMD[3][1],亦被称为Godson-MMX [4]。LoongMMI指令集手册也在2F时代公开[3][4][5][6][7]

龙芯课题组成为龙芯中科公司后,陆续研发了更多种类的芯片和微架构, 这些微架构在不同程度上实现了LoongMMI,但LoongISA版本的LoongMMI和原龙芯2F上所实现的LoongMMI有一定不同。虽然龙芯中科原本设计的GS232IP核计划自带LoongMMI[8],但以此微架构所实现的芯片例如龙芯1A300、龙芯1B、龙芯1C300从未真正实现过LoongMMI 。

LoongMMI现已用于龙芯的ffmpeg媒体编解码库[1],gcc社区也支持了此指令集LoongISA版本的优化选项(-mloongson-mmi)。此优化选项也被纳入到-march=loongson3a龙芯64通用架构及以后的微架构选项当中。[9]相对于不使用此指令集,LoongMMI指令集的使用使多数多媒体格式的编解码的性能得到成倍提升。[10]

编译器相关选项

若要在龙芯2F上使用2F版的LoongMMI 可以在编译时选择-march=loongson2f来使用此指令集[9]

若要在龙芯3A1000及以后的中央处理器SoC上使用LoongISA版本的LoongMMI,可以在编译时单独选择 -mloongson-mmi,亦可选择龙芯64通用架构-march=loongson3a 或者是具体到单一的微架构,例如-march=gs464来使用此指令集[9]

参考文献

  1. ^ 1.0 1.1 1.2 1.3 顾丽红、王锐、陈华才、吴少刚. 基于龙芯SIMD技术的H.264视频解码优化. 《计算机工程与设计》. 2017, (2017年12期): 8. doi:10.16208/j.issn1000-7024.2017.12.030. [失效連結]
  2. ^ 2.0 2.1 龙芯 3A1000 处理器用户手册 下册 GS464 处理器核 V1.4 (PDF). [2020-04-11]. (原始内容存档 (PDF)于2018-04-13). 
  3. ^ 3.0 3.1 龙芯 SIMD 指令使用手册 (PDF). [2020-04-11]. (原始内容 (PDF)存档于2020-12-01). 
  4. ^ 4.0 4.1 Godson MultiMedia Technology (PDF). [2020-04-11]. (原始内容 (PDF)存档于2020-04-11). 
  5. ^ 龙芯 2F 处理器用户手册 V1.5 (PDF). [2020-04-11]. (原始内容存档 (PDF)于2020-11-24). 
  6. ^ 龙芯 2F 处理器用户手册 (PDF). [2020-04-11]. (原始内容 (PDF)存档于2020-12-01). 
  7. ^ UM0447 User manual - STLS2F01 (PDF). (原始内容 (PDF)存档于2020-04-11). 
  8. ^ 龙芯芯片产品技术白皮书 V2.0 (PDF). [2020-04-11]. (原始内容 (PDF)存档于2020-12-01). 
  9. ^ 9.0 9.1 9.2 GNU Binutils 2.32 Branched Ahead Of Release With New Features - Phoronix. www.phoronix.com. [2019-11-26]. (原始内容存档于2020-09-19). 
  10. ^ FFmpeg解码性能测试结果. www.loongnix.org. [2019-11-26]. (原始内容存档于2020-11-30). 

参见

  • 计算机科学主题
  • 信息技术主题
精簡指令集(RISC)
多媒體加速擴展指令集 (MAX)
MDMX · MIPS-3D · MSA
龙芯多媒体扩展指令集 (LoongMMI) · 龙芯向量扩展指令集(LoongSX) · 龙芯高级向量扩展指令集(LoongASX)
動態視訊指令集 (MVI)
NEON
複雜指令集(CISC)
x86/x86-64
MMX · 3DNow! · 流式單指令流多資料流擴展指令集 (SSE) · SSE2 · SSE3 · 擴展SSE3 (SSSE3) · SSE4 · SSE4a · SSE5 → XOP、F16C/CVT16、FMA(包括FMA4、FMA3) · 進階加密標準指令集 (AES) · 進階矢量擴展指令集 (AVX、AVX1.1、AVX2、AVX-512) · 位操作指令集 (ABM、BMI1、BMI2、TBM)
指令集 = 被取代或取消
IBM 801 · 伯克利 RISC英语Berkeley RISC · 斯坦福 MIPS英语Stanford MIPS
活跃
历史
处理器技术
模型
顺序模型
函数式模型
架構
  • 微架構
  • 冯·诺伊曼结构
  • 哈佛架構
    • 修正哈佛架構英语Modified Harvard architecture
  • 資料流架構英语Dataflow architecture
  • 传输触发英语Transport triggered architecture
  • 元胞英语Cellular architecture
  • 字节序
  • 异构英语Heterogeneous System Architecture
  • Fabric英语Fabric computing
  • 多元處理
  • 認知計算
  • 神经形态英语Neuromorphic engineering
内存访问
缓存层级英语Cache hierarchy
  • 缓存层级英语Cache hierarchy
記憶體階層
指令集架構
类型
指令集
执行
  • 流水线停顿
  • 操作数转发英语Operand forwarding
  • 经典 RISC 流水线英语Classic RISC pipeline
危障
  • 分支預測
    • 存储相关性预测英语Memory dependence prediction
并行计算
并行层次
執行緒
電腦性能
類別維基數據所列Q124996351
按应用
片上系统
  • 片上系统(SoC)
  • 多处理器片上系统英语Multi-processor system-on-chip(MPSoC)
  • 可编程片上系统(PSoC)
  • 片上网络英语Network on a chip(NoC)
字长
核心数量
組件
功能单元
邏輯閘
寄存器
总线
控制单元
数据通路
電路
电源管理
相关内容