Column 0 = 0 8
Column 1 = 2 10
Column 2 = 4 12
Column 3 = 6 14
Представленные в примерах 11.30 и 11.31 определение шаблона класса kmatrix
и пример его использования очень напоминают шаблон класса matrix
из рецепта 11.14. Единственным существенным отличием является то, что при объявлении экземпляра kmatrix
приходится передавать размерности матрицы через параметры шаблона, например;
kmatrix<int 5, 6> m; // объявляет матрицу с пятью строками и шестью
// столбцами
В приложениях многих типов часто требуется, чтобы матрицы имели размерности, известные на этапе компиляции. Передача размера строк и столбцов через параметры шаблона позволяет компилятору легче применять такую оптимизацию, как развертка цикла, встраивание функций и ускорение индексации.
Как и рассмотренный ранее шаблон статического вектора (
kvector
), шаблон kmatrix
особенно эффективен при небольших размерах матрицы.
Рецепты 11.14 и 11.16.
11.16. Умножение матриц
Требуется эффективно выполнить умножение двух матриц.
Пример 11.32 показывает, как можно выполнить умножение матриц, причем эта реализация подходит как для динамических, так и для статических матриц. Формально этот алгоритм реализует соотношение A=A+B*C, которое (возможно, неожиданно) вычисляется более эффективно, чем A=B*C.
#include 'matrix.hpp' // рецепт 11.13
#include 'kmatrix.hpp' // рецепт 11.14
#include <iostream>
#include <cassert>
using namespace std;
template<class M1, class M2, class M3>
void matrixMultiply(const M1& m1, const M2& m2, M3& m3) {
assert(m1.cols() == m2.rows());
assert(m1.rows() == m3.rows());
assert(m2.cols() == m3.cols());
for (int i=m1.rows()-1; i >= 0; --i) {
for (int j=m2.cols()-1; j >= 0; --j) {
for (int k = m1.cols()-1; k >= 0; --k) {
m3[i][j] += m1[i][k] * m2[k][j];
}
}
}
}
int main() {
matrix<int> m1(2, 1);
matrix<int> m2(1, 2);
kmatrix<int, 2, 2> m3;
m3 = 0;
m1[0][0] = 1;
m1[1][0] = 2;
m2[0][0] = 3;
m2[0][1] = 4;
matrixMultlply(m1, m2, m3);
cout << '(' << m3[0][0] << ', ' << m3[0][1] << ')' << endl;
cout << '(' << m3[1][0] << ', ' << m3[1][1 ] << ')' << endl;
}
Программа примера 11.32 выдает следующий результат.
(3, 4)
(6, 8)
При умножении двух матриц число столбцов первой матрицы должно равняться числу строк второй матрицы. Число строк полученной матрицы равно числу строк первой матрицы, а число столбцов равно числу столбцов второй матрицы. Я обеспечиваю эти условия в отладочной версии с помощью макроса assert
, определенного в заголовочном файле <cassert>
.
Решающее значение для эффективной реализации умножения имеет отсутствие избыточных операций по созданию и копированию временных объектов. Так, представленная в примере 11.32 функция умножения матриц передает результат по ссылке. Если бы алгоритм умножения я реализовал впрямую путем перегрузки оператора operator*
, это привело бы к лишним операциям распределения, копирования и освобождения памяти, занимаемой временной матрицей. Потенциально такой подход может оказаться очень затратным при работе с большими матрицами.
В примере 11.32 реализуется равенство
A=A+B*C
, а не A=B*C
, для того чтобы избежать лишней инициализации значений матрицы A
.
Рецепт 11.17.
11.17. Вычисление быстрого преобразования Фурье
Требуется выполнить эффективный расчет дискретного преобразования Фурье (ДПФ), используя алгоритм быстрого преобразования Фурье (БПФ).