当前位置：文档库 › DSP4x4矩阵相乘

DSP4x4矩阵相乘

【线性代数】之矩阵的乘法运算

Born T o Win 考研数学线性代数之矩阵的乘法运算任意两个矩阵不一定能够相乘，即两个矩阵要相乘必须满足的条件是：只有当第一个矩阵A 的列数与第二个矩阵B 的行数相等时A ×B 才有意义。一个m ×n 的矩阵A 左乘一个n ×p 的矩阵B ，会得到一个m ×p 的矩阵C 。左乘：又称前乘，就是乘在左边(即乘号前)，比如说,A 左乘E 即AE 。一个m 行n 列的矩阵与一个n 行p 列的矩阵可以相乘，得到的结果是一个m 行p 列的矩阵，其中的第i 行第j 列位置上的数为第一个矩阵第i 行上的n 个数与第二个矩阵第j 列上的n 个数对应相乘后所得的n 个乘积之和。比如，下面的算式表示一个2行2列的矩阵乘以2行3列的矩阵，其结果是一个2行3列的矩阵。其中，结果矩阵的那个4（结果矩阵中第二（i ）行第二（j)列）= 2（第一个矩阵第二(i)行第一列）*2（第二个矩阵中第一行第二(j)列） + 0（第一个矩阵第二(i)行第二列）*1（第二个矩阵中第二行第二(j)列）：矩阵乘法的两个重要性质：一，矩阵乘法满足结合律；二，矩阵乘法不满足交换律。为什么矩阵乘法不满足交换律呢？这是由矩阵乘法定义决定的。因为矩阵AB=C ，C 的结果是由A 的行与B 的列相乘和的结果；而BA=D ，D 的结果是由B 的行与A 的列相乘和的结果。显然，得到的结果C 和D 不一定相等。同时，交换后两个矩阵有可能不能相乘。因为矩阵乘法不满足交换律，所以矩阵乘法也不满足消去律。即由AB=AC 是得不到B=C 的，这是因为()AB AC A B C O =?-=是得不到A=O 或B-C=O 即B=C.例 111000010A B ????=≠=≠ ? ?-????0，但0000AB O ??== ??? 那么由AB=O 一定得不到A=O 或B=O 吗？回答是否定的。比如A 是m ×n 阶矩阵，B 是n ×s 阶矩阵，若A 的秩为n ，则AB=O ，得B=O ；若B 的秩为m ，则AO ，得A=O.为什么吗？原因会在有关齐次线性方程组的文章里进行讲解.

矩阵相乘的快速算法

矩阵相乘的快速算法算法介绍矩阵相乘在进行3D变换的时候是经常用到的。在应用中常用矩阵相乘的定义算法对其进行计算。这个算法用到了大量的循环和相乘运算，这使得算法效率不高。而矩阵相乘的计算效率很大程度上的影响了整个程序的运行速度，所以对矩阵相乘算法进行一些改进是必要的。这里要介绍的矩阵算法称为斯特拉森方法，它是由v.斯特拉森在1969年提出的一个方法。我们先讨论二阶矩阵的计算方法。对于二阶矩阵 A= a11a12 B= b11b12 a21a22b21 b22 先计算下面7个量(1) x1 = (a11 + a22) * (b11 + b22); x2 = (a21 + a22) * b11; x3 = a11 * (b12 - b22); x4 = a22 * (b21 - b11); x5 = (a11 + a12) * b22; x6 = (a21 - a11) * (b11 + b12); x7 = (a12 - a22) * (b21 + b22); 再设C = AB。根据矩阵相乘的规则，C的各元素为(2) c11 = a11 * b11 + a12 * b21 c12 = a11 * b12 + a12 * b22 c21 = a21 * b11 + a22 * b21 c22 = a21 * b12 + a22 * b22 比较(1)(2)，C的各元素可以表示为(3) c11 = x1 + x4 - x5 + x7 c12 = x3 + x5 c21 = x2 + x4 c22 = x1 + x3 - x2 + x6 根据以上的方法，我们就可以计算4阶矩阵了，先将4阶矩阵A和B划分成四块 2阶矩阵，分别利用公式计算它们的乘积，再使用(1)(3)来计算出最后结果。

strassen矩阵相乘算法C++代码

Strassen 矩阵相乘算法代码 #include #include #include #include usingnamespace std; template class Strassen_class { public: void ADD(T** MatrixA, T** MatrixB, T** MatrixResult, int MatrixSize); void SUB(T** MatrixA, T** MatrixB, T** MatrixResult, int MatrixSize); void MUL(T** MatrixA, T** MatrixB, T** MatrixResult, int MatrixSize);//朴素算法实现void FillMatrix(T** MatrixA, T** MatrixB, int length);//A,B矩阵赋值 void PrintMatrix(T **MatrixA, int MatrixSize);//打印矩阵 void Strassen(int N, T **MatrixA, T **MatrixB, T **MatrixC);//Strassen算法实现 }; template void Strassen_class::ADD(T** MatrixA, T** MatrixB, T** MatrixResult, int MatrixSize) { for (int i = 0; i void Strassen_class::SUB(T** MatrixA, T** MatrixB, T** MatrixResult, int MatrixSize) { for (int i = 0; i void Strassen_class::MUL(T** MatrixA, T** MatrixB, T** MatrixResult, int MatrixSize) {

矩阵连乘最佳加括号方式动态规划算法

矩阵连乘最佳加括号方式－动态规划算法一、问题描述给定n个矩阵{A1,A2,…,A n}，其中A i与A i+1是可乘的，i=1,2,…,n-1。要算出这n个矩阵的连乘积A1A2…A n。由于矩阵乘法满足结合律，故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定，也就是说该连乘积已完全加括号，则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。完全加括号的矩阵连乘积可递归地定义为：（1）单个矩阵是完全加括号的；（2）矩阵连乘积A是完全加括号的，则A可表示为2个完全加括号的矩阵连乘积B和C 的乘积并加括号，即A=(BC)。例如，矩阵连乘积A1A2A3A4有5种不同的完全加括号的方式：（A1（A2（A3A4））），（A1（（A2A3）A4）），（（A1A2）（A3A4）），（（A1（A2A3））A4），（（（A1A2）A3）A4）。每一种完全加括号的方式对应于一个矩阵连乘积的计算次序，这决定着作乘积所需要的计算量。若A是一个p×q矩阵，B是一个q×r矩阵，则计算其乘积C=AB的标准算法中，需要进行pqr次数乘。为了说明在计算矩阵连乘积时，加括号方式对整个计算量的影响，先考察3个矩阵 {A1,A2,A3}连乘的情况。设这三个矩阵的维数分别为10×100，100×5，5×50。加括号的方式只有两种：（（A1A2）A3），（A1（A2A3）），第一种方式需要的数乘次数为10×100×5＋10×5×50＝7500，第二种方式需要的数乘次数为100×5×50＋10×100×50＝75000。第二种加括号方式的计算量时第一种方式计算量的10倍。由此可见，在计算矩阵连乘积时，加括号方式，即计算次序对计算量有很大的影响。于是，自然提出矩阵连乘积的最优计算次序问题，即对于给定的相继n个矩阵{A1,A2,…,A n}（其中矩阵A i的维数为p i-1×p i，i＝1,2,…,n），如何确定计算矩阵连乘积A1A2…A n的计算次序（完全加括号方式），使得依此次序计算矩阵连乘积需要的数乘次数最少。穷举搜索法的计算量太大，它不是一个有效的算法，本实验采用动态规划算法解矩阵连乘积的最优计算次序问题。二、算法思路

矩阵乘法运算的C语言程序

#include #define N 30 #define M 30 void juzhen_mul(int m,int n,int *p1[M],int m1,int n1,int *p2[M]) { int i,j,x=0; int c[N][M]={0}; for(i=0;i

} } void main() { int a[N][M],b[N][M]; int n,m,n1,m1,i,j; int *pa[M],*pb[M]; printf("请选择A矩阵的行数和列数：\n"); scanf("%d %d",&m,&n); for(i=0;i

} printf("请选择B矩阵的行数和列数：\n"); scanf("%d %d",&m1,&n1); for(i=0;i

矩阵相乘的算法设计

数据结构与算法设计课程实验报告课题矩阵相乘的算法设计专业班级网工专业1405班学号14144501352 姓名陈晓露指导教师陶跃进

目录一、问题描述二、问题分析 1、分析最优解的结构 2、建立递归关系 3、递归实现的复杂性 4、算法迭代实现三、结果输出四、实验总结

一、问题描述给定n个矩阵｛A1，A2，... ，An｝，其中这n个矩阵是可相乘的，i＝1，2，...，n-1。算出这n个矩阵的相乘积A1A2 。。。An。补充：如果两个矩阵A和B是可相乘的，那么A的列数要和B的行数是相同的，否则，这两个矩阵是不可相乘的。它们的相乘结果矩阵C的行数是A的行数，而列数是B的列数。设A1,A2,…,An为矩阵序列，Ai为Pi-1×Pi阶矩阵，i = 1,2,…,n. 确定乘法顺序使得元素相乘的总次数最少. 输入：向量P = 实例： P = <10, 100, 5, 50> A1: 10 × 100, A2: 100 × 5, A3: 5 × 50 乘法次序： (A1 A2)A3: 10 × 100 × 5 + 10 ×5 × 50 = 7500 A1(A2 A3): 10 × 100 × 50 + 100 × 5 × 50 = 75000 搜索空间的规模先将矩阵链加括号分为两部分，即P=A1*A2*...*An=（A1*A2...*Ak）*（Ak+1*...An），则有f(n)=f(1)*f(n-1)+f(2)*f(n-2)+...+f(n-1)*f(1)种方法。动态规划算法输入P=< P0, P1, …, Pn>，Ai..j 表示乘积 AiAi+1…Aj 的结果，其最后一次相乘是： m[i,j] 表示得到Ai..j的最少的相乘次数。递推方程：为了确定加括号的次序，设计表s[i,j],记录求得最优时最一位置。二、问题分析由于矩阵乘法满足结合律，故连乘积的计算可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序已完全确定，也就是说该连乘积已完全加括号，则我们可以通过反复调用两个矩阵相乘的标准算法计算出矩阵连乘积。 1.分析最优解的结构为了方便起见，我们将矩阵连乘AiAi+1 。。。Aj记为A[i:j]。经分析，计算A[1:n]的一个最优次序所包含的计算矩阵子链A[1:k]和A[k:n]的次序也是最优的。因此，矩阵连乘计算次序问题的最优解包含着子问题的最优解。 2.建立递归关系用矩阵m[n][n]来存放A[i:j]相乘的计算次数，用p[n+1]用来存放矩阵的行数和列数。 const int N=5; int m[N][N]; //m[i][j]存储Ai到Aj的最小乘法次数

算法训练矩阵乘法

算法训练矩阵乘法时间限制：内存限制：问题描述输入两个矩阵，分别是m*s，s*n大小。输出两个矩阵相乘的结果。输入格式第一行，空格隔开的三个正整数m,s,n（均不超过200）。接下来m行，每行s个空格隔开的整数，表示矩阵A（i，j）。接下来s行，每行n个空格隔开的整数，表示矩阵B（i，j）。输出格式 m行，每行n个空格隔开的整数，输出相乘後的矩阵C（i，j）的值。样例输入 2 3 2 1 0 -1 1 1 -3 0 3 1 2

3 1 样例输出 -3 2 -8 2 提示矩阵C应该是m行n列，其中C(i,j)等于矩阵A第i 行行向量与矩阵B第j列列向量的内积。例如样例中C(1,1)=(1,0,-1)*(0,1,3) = 1 * 0 +0*1+(-1)*3=-3 #include #include #include using namespace std; #define vector vector int m,s,n; vector readH(int a[][202],int m,int s,int H) { vector myT; for(int i=1;i<=s;i++) {

(a[H][i]); } return myT; } vector readL(int b[][202],int s,int n,int L) { vector myT; for(int i=1;i<=s;i++) { (b[i][L]); } return myT; } int main() { cin>>m>>s>>n; int a[m+1][202],b[s+1][202]; for(int i=1;i<=m;i++) { for(int j=1;j<=s;j++) {

矩阵乘积的运算法则的证明

矩阵乘积的运算法则的证明矩阵乘积的运算法则 1 乘法结合律：若n m C A ?∈,p n C B ?∈ , q p C C ?∈，则C AB BC A )()(=. 2 乘法左分配律：若A 和B 是两个n m ?矩阵，且C 是一个p n ?矩阵，则BC AC C B A +=+)(. 3 乘法右分配律：若A 是一个n m ?矩阵，并且B 和C 是两个p n ?矩阵，则BC AC C B A +=+)(. 4 若α是一个标量，并且A 和B 是两个m n ?矩阵，则B A B A ααα+=+)(. 证明 1 ①先设n 阶矩阵为)(ij a A =,)(ij b B =, )(ij c C =,)(ij d AB =,)(ij e BC = )(ij f ABC =,)()(ij g BC A =,有矩阵的乘法得：故对任意n j i 2,1,=有： =ij g 故)()(BC A C AB = ②再看 mn ik a A )(= ,np kj b B )(=,pq jt c C )(=, mp ij d AB )(= , nq kt e BC )(= , mq it g BC A )()(=, 有矩阵的乘法得：故对任意的,2,1m i = ,2,1p j = ,2,1n k = q t 2,1=有： 6nt in t i t i e a e a e a +++= 2211 =ij g 故)()(BC A C AB = 证明 2 设ij A 表示矩阵A 的第i 行，第j 列上的元素，则有

=ij ij BC AC )()(+ 故证出矩阵乘法左分配律. 证明 3 同理矩阵乘法左分配律可得 = []ij C B A )(+ 故证出矩阵乘法左分配律. 证明 4 设????????????==mn m m n n mn ij a a a a a a a a a a A 2122221 11211)(，????????????==mn m m n n mn ij b b b b b b b b b b B 2 12222111211)(，可得=+B A ????????????+++++++++mn mn m m m m n n n n b a b a b a b a b a b a b a b a b a 221 12222 2221211112 121111， =A α????????????mn m m n n a a a a a a a a a ααααααααα 212222111211，B α????????????=mn m m n n b b b b b b b b b ααααααααα 21 2222111211， B A αα+???? ??????? ?+++++++++=)()()()()()()()()(221122222221211112121111mn mn m m m m n n n n b a b a b a b a b a b a b a b a b a ααααααααα ，所以)(B A +α=B A αα+.

两矩阵相乘算法

两矩阵相乘算法一、实验描述实验要求实现两矩阵的相乘，并将结果输出。二、实验原理两个矩阵相乘也是矩阵的一种常用的运算。设矩阵M 是m1×n1矩阵，N 是m2×n2矩阵；若可以相乘，则必须满足矩阵M 的列数n1与矩阵N 的行数m2相等，才能得到结果矩阵Q=M ×N （一个m1×n2的矩阵）。数学中矩阵Q 中的元素的计算方法如下：其中： 1≤i ≤m1, 1≤j ≤n2。三、实验代码 #include #include using namespace std; void main() { const int m=3; const int n=3; int a[m][n],i,j; for(i=0;i

Strassen矩阵相乘算法的c++代码实现

#include #include #include using namespace std; int multiply(intn,int A[64][64],int B[64][64],int C[64][64]); int sub(int A[64][64],int B[64][64],int C[64][64],int n); int add(int A[64][64],int B[64][64],int C[64][64],int n); int main() { int n; cin>>n; inti,j; int C[64][64]; int A[64][64]; for(inti=0;i>A[i][j]; //输入A } } int B[64][64]; for(inti=0;i>B[i][j]; //输入B } } multiply(n,A,B,C); //调用递归函数 for(inti=0;i

{ cout<

矩阵相乘并行算法

并行处理技术课程设计分析报告课程设计题目矩阵相乘并行算法设计姓名廖杰学号M201372880 专业计算机技术任课教师金海石宣化所在学院计算机科学与技术学院报告提交日期2014-01-13

一、实验目的 1、学习使用集群； 2、掌握并行处理或分布计算的编程方法； 3、学会以并行处理的思想分析问题。二、实验要求 1、自行生成矩阵作为算法的输入； 2、使用并行处理技术编程，例如：MPI、OpenMP、MR； 3、矩阵大小至少为1000*1000； 4、加速比越大成绩越高。三、实验内容 3.1、矩阵的划分：对于矩阵相乘的并行算法，可以有三种：对矩阵按行划分、按列划分和棋盘式分块划分。和按行或列划分相比，棋盘式划分可以开发出更高的并行度。对于一个n×n的方阵，棋盘划分最多可以使用n^2个处理器进行并行计算，但使用按行或列分解最多可以使用n个。对矩阵相乘采用棋盘式划分的算法通常称作Cannon算法。 A）行列划分又叫带状划分（Striped Partitioning），就是将矩阵整行或者整列分成若干个组，每个组指派给一个处理器。下图所例为4个CPU，8×8矩阵的带状划分。

在带状划分情况下，每个CPU将会均匀分配到2行(列)数据。8×8矩阵变成了一个1×4或4×1的分块矩阵，每个CPU所属的分块矩阵大小为8×2或2×8。

B）棋盘划分就是将矩阵分成若干个子矩阵，每个子矩阵指派给一个处理器，此时任一处理器均不包含整行或者整列。下图所示即为4个处理器情况下8×8矩阵的棋盘划分，其中处理器阵列为2×2，每个处理器分配到的子矩阵大小为4×4。矩阵划分成棋盘状可以和处理器连成二维网孔相对应。对于一个n×n维矩阵和p×p的二维处理器阵列，每个处理器均匀分配有（n/p）×(n/p)=n^2/p^2个元素。使用棋盘式划分的矩阵相乘算法一般有两种，Cannon算法和Summa算法。SUMMA算法能够计算 m*l的A矩阵和l*n的B矩阵相乘（m、l、n可不相等），而cannon算法只能实现n*n 的A矩阵和n*n的B矩阵相乘，具有很大的局限性。 3.2、算法原理 A) 行划分法假设是M*N，计算前，将矩阵N发送给所有从进程，然后将矩阵M分块，将M中数据按行分给各从进程，在从进程中计算M中部分行数据和N的乘积，最后将结果发送给主进程。这里为了方便，有多少进程，就将M分了多少块，除最后一块外的其他数据块大小都相等，最后一块是剩下的数据，大小大于等于其他数据块大小，因为矩阵行数不一定整除进程数。最后一块数据在主进程中计算，其他的在从进程中计算。定义两个矩阵M和N，N所有进程都需要，M可以只在主进程中定义。其他的变量视主进程和从进程需要按要求定义在合适的位置。

矩阵连乘问题

目录：矩阵连乘问题： 1. 描述矩阵连乘问题 2. 分析矩阵连乘问题以及对递归式的推导（1）直接递归思路（2）备忘录思路（3）动态规划思路 3. 伪代码的方式描述算法：（1）直接递归算法（2）备忘录算法（3）动态规划算法 4. 把算法转换成程序实现的过程及结果（1）直接递归算法程序（2）备忘录算法程序（3）动态规划算法程序

1.描述矩阵连乘问题：给定n 个矩阵{n A A A ?,2,1}，其中i A 和1+i A 是可乘的，i=1,2,…,n-1。考察这n 个矩阵的连乘积n A A A ?,2,1。由于矩阵乘法具有结合律，故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定，也就是说连乘积已完全加括号，则可依次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。完全加括号的矩阵连乘可递归地定义为：（1）单个矩阵是完全加括号的；（2）矩阵连乘积A 是完全加括号的，则A 可表示为2个完全加括号的矩阵连乘B 和C 的乘积并加括号，即A=（BC ）。矩阵A 和B 可乘的条件是矩阵A 的列数等于矩阵B 的行数。若A 是一个p ×q 的矩阵，B 是一个q ×r 的矩阵，那么C=A ×B 就是一个p ×r 矩阵。它的计算是三重循环的，计算量是pqr 。如果加括号后矩阵的量是不同的，所以我们的问题就是要讨论如何给连乘的矩阵加括号才能使矩阵的计算量最少。穷举搜索法：对于n 个矩阵的连乘积，设有不同的计算次序P(n)。由于可以先在第k 个和第k+1个矩阵之间将原矩阵序列分为两个矩阵子序列，k=1,2,...,n-1；然后分别对这两个矩阵子序列完全加括号；最后对所得的结果加括号，得到原矩阵序列的一种完全加括号方式。由此可得P(n)的递归式如下： 1 n=1 P （n ）= ∑-=-1 1 )()(n k k n P k P n>1 解此递归方程可得，P(n)=C(n-1),而C(n)是一个指数增长的函数。因此穷举搜索法不是一个有效的算法。以下将用三种方法来解决矩阵连乘问题的最优加括号方式以及最优解。 2. 分析矩阵连乘问题以及对递归式的推导将矩阵连乘积j i i A A A ?+,1,简记为A[i:j]。考察计算A[1:n]的最优计算次序。这个问题的一个关键特征是：计算A[1:n]的最优次序包含的计算矩阵子链A[1:k]和A[k+1:n]的次序也是最优的。这是因为：定义矩阵A i 的维数为p i-1×p i ,则A[i:k]的计算次数为p i-1×p k ，A[k+1,j]的计算次数为p k ×p j ，而这两个总的矩阵最后相乘时的计算量是固定的，为p i-1×p k ×p j 。所以，矩阵连乘计算次序问题的最优解包含着其子问题的最优解。这种性质称为最优子结构性质。（1）、直接递归的思路：记计算A[i:j]，1≤i ≤j ≤n ，所需最少数乘次数为m[i][j],则原问题的最优质为m[1][n]。由分析得知：m[i][j]可以递归的定义为： 0 i=j m[i][j]= }]][1[]][[{min 1j k i j k i p p p j k m k i m -≤≤+++ i