lecture03: функции, указатели, ссылки, структуры

3 лет назад · 6c14501bc6
--- a/README.md
+++ b/README.md
@ -6,7 +6,7 @@

 1. [Основы языка C++](lectures/lecture01)
 2. [Системы контроля версий](lectures/lecture02)
-3. Структурирование кода и данных (функции, указатели)
+3. [Структурирование кода и данных (функции, указатели)](lectures/lecture03)
 4. Сборка программ из нескольких файлов
 5. Ввод-вывод, модульное тестирование
 6. Библиотеки
--- a/lectures/lecture03/README.md
+++ b/lectures/lecture03/README.md
@ -0,0 +1,554 @@
+# Лекция 3. Функции, указатели, ссылки, структуры
+
+## Функции (повторение)
+
+Функция — это именованный блок кода с формальными параметрами
+и возвращаемым значением.
+
+Пример:
+
+```cpp
+double
+multiply(double x, int y) {
+    return x * y;
+}
+```
+
+Здесь `double` — тип возвращаемого значения (результата),
+`multiply` — имя функции,
+`(double x, int y)` — список формальных параметров,
+а в фигурных скобках — тело функции.
+
+Если вместо типа возвращаемого значения указать `void`,
+это значит, что функция значения не возвращает.
+
+Тип возвращаемого значения, имя функции и список формальных параметров
+могут быть разнесены по строкам в соответствии со стилем и читаемостью.
+Например, мы в лабораторных работах предпочитаем тип возвращаемого значения
+писать на отдельной строке.
+С точки зрения C++ это безразлично.
+
+Типы ее формальных параметров составляют *сигнатуру* функции.
+Отметим, что тип возвращаемого значения, имя функции и имена параметров
+в сигнатуру не входят.
+Например, сигнатура `multiply`: `(double, int)`.
+
+Оператор `return` определяет возвращаемое значение
+и немедленно завершает функцию.
+В `void`-функциях тоже можно использовать `return` без указания результата,
+чтобы немедленно выйти из функции.
+
+**Внимание.**
+Выполнение не-`void` функции всегда должно заканчиваться `return`,
+хотя C++ не отслеживает это жестко (но может выдать предупреждение).
+
+Внутри тела функции её формальные параметры являются локальными переменными.
+Они независимы от переменных в месте вызова функции,
+даже если у них одинаковые имена:
+
+```cpp
+void func(int x) {
+    x = 66;
+}
+...
+int x = 42;
+func(x);
+// x == 42
+```
+
+При вызове функции значения, переданные ей в качестве аргументов,
+*копируются* в её переменные-параметры.
+
+## Указатели (повторение)
+
+**Примечание.**
+В этой лекции не рассматривается динамическое выделение памяти,
+а только сами указатели как тип данных и их применение в связи с функциями.
+
+Всю память компьютера можно представить как массив байтов.
+Тогда индекс в этом массиве, то есть номер ячейки памяти,
+называется *адресом,* а переменная, содержащая адрес, называется *указателем.*
+
+При объявлении указателей перед именем переменной ставится звездочка.
+Например, так объявляется указатель на действительное число:
+
+```cpp
+double* r1;
+```
+
+Часто звездочку прижимают к имени типа, а не переменной, как в примере.
+Есть известная «ловушка»:
+
+```cpp
+double* x, y;
+```
+
+Здесь только `x` является указателем (имеет тип `double*`),
+а `y` является обычной переменной (имеет тип `double`).
+Надо либо ставить звездочку перед каждой переменной-указателем,
+либо объявлять каждую переменную отдельно (это почти всегда нагляднее).
+
+В указатель записывается не значение переменной, а ее адрес.
+Адрес берется *оператором взятия адреса* в виде амперсанда (`&`):
+
+```cpp
+double x = 3.14;
+double* p = &x;
+```
+
+Вот как расположены при этом данные в памяти:
+
+```
+адреса:        0   1       8   9   10  11  12      42  43  44  45  46
+            +---+-     -+---+---+---+---+-     -+---+---+---+---+-
+ячейки:     |   | ..... |     3.14      | ..... |       8       | ...
+            +---+-     -+---+---+---+---+-     -+---+-.'+---+---+-
+                        ↑\_____________/         \__.'_________/
+                        |       x                 .'    p
+                        |                       .'
+                       &x = 8 = ...............'
+```
+
+Чтобы, имея указатель, обратиться к тем данным, адрес которых он хранит,
+используется оператор *разыменования* в виде звездочки:
+
+```cpp
+*p = 2.71;  // x = 2.71
+```
+
+Есть специальное значение указателя — нулевой: `NULL`, `0` или `nullptr`.
+Указатель, хранящий такой адрес, запрещено разыменовывать.
+
+Начальное значение указателя, если оно не присвоено явно, не определено,
+как и для любых других переменных встроенных типов.
+Таким образом, переменной-указателем нельзя корректно пользоваться,
+пока ей что-нибудь не присвоено.
+
+### Висячие указатели (dangling pointers)
+
+К сожалению, C++ не отслеживает, что значение указателя всегда корректно.
+Рассмотрим пример:
+
+```cpp
+int* p = nullptr;
+if (...) {
+    int x;
+    p = &x;
+    ...
+}
+cout << *p;
+```
+
+В последней строке `p` указывает на переменную, которая объявлена внутри `if`
+и уже не существует после выхода из фигурных скобок.
+Поэтому, хотя указатель и хранит не `nullptr`, разыменовывать его нельзя.
+Такие указатели на данные, которых уже нет, называются *висячими (dangling).*
+
+Другой пример:
+
+```cpp
+int* func() {
+    int x = 42;
+    return &x;
+}
+...
+auto p = func();
+cout << *p;
+```
+
+Здесь функция возвращает адрес локальной переменной.
+Однако локальные время жизни локальных переменных ограничено функцией,
+поэтому пользоваться таким возвращаемым значением нельзя.
+
+При работе с указателями надо всегда думать о том,
+чтобы время жизни указателя не превышало время жизни данных,
+адрес которых указатели хранят.
+
+## Ссылки
+
+Ссылка (reference) — это новое имя для существующего объекта.
+Объект может быть переменной или её частью, такой как элемент массива.
+
+Ссылки объявляются с использованием амперсанда:
+
+```cpp
+int var = 42;
+int& ref = var;
+```
+
+Не следует путать амперсанд при объявлении ссылок
+с амперсандом-оператором взятия адреса!
+
+Обращение к ссылке эквивалентно обращению к тому, на что она ссылается:
+
+```cpp
+cout << ref;  // 42
+ref = 66;
+cout << var;  // 66
+```
+
+В частности, так как ссылка не является самостоятельной переменной,
+её адрес — это адрес того, на что она ссылается,
+а явное разыменование не нужно (если это не ссылка на указатель, конечно):
+
+```cpp
+if (&var == &ref) { ... }   // истинно
+
+*ref = 66;                  // ОШИБКА: обращение к ref — обращение к var,
+                            // а var не указатель, разыменовать её нельзя.
+```
+
+Поскольку ссылка — новое имя для *существующего* объекта,
+у нее всегда должно быть начальное значение:
+
+```cpp
+int& ref;  // ОШИБКА: новое имя для чего?
+```
+
+Не бывает «нулевой ссылки», подобной нулевому указателю.
+
+Даже вне связи с функциями ссылки могут применяться,
+чтобы дать более короткие или понятные имена в коде:
+
+```cpp
+double& first = some_vector[0];
+// ...
+fisrt = 0;
+```
+
+### Передача входных параметров функций по ссылкам
+
+Рассмотрим функцию, суммирующую элементы вектора:
+
+```cpp
+double sum(vector<double> xs) {
+    double total{};
+    for (double x : xs) {
+        total += x;
+    }
+    return total;
+}
+```
+
+Вспомним, что при вызове функции значения аргументов *копируются*
+в переменные-формальные параметры, то есть в `xs` будет помещена копия вектора,
+который передан функции.
+Если этот вектор большой, будет потрачено много лишней памяти,
+кроме того, это копирование бесполезно — функция не меняет `xs` даже внутри.
+
+Можно передавать `xs` по ссылке, чтобы не копировать вектор,
+а работать с той переменной, которую передали функции, напрямую:
+
+```cpp
+double sum(vector<double>& xs) { ... }
+...
+vector<double> xs;
+double s = sum(xs);
+```
+
+Однако есть две проблемы:
+
+* Нельзя вызвать `sum({1, 2, 3})`,
+    потому что `{1, 2, 3}` — выражение, а не переменная.
+    Это запрещено, потому что с помощью ссылки возможно поменять то,
+    на что она ссылается, однако выражение поменять нельзя в принципе.
+    (Можно изменить значение переменной, содержащей `5 = 3 + 2`,
+    но нельзя поменять саму `5`, «пятерку как таковую».)
+
+* При чтении кода непонятно, не меняет ли `sum()` свой аргумент,
+    и нет гарантий, что она этого не начнет делать в будущем.
+
+Итак, нужно сослаться на аргумент, но сделать этот так,
+чтобы с точки зрения `sum()` эта переменная была неизменяемой,
+даже если в месте вызова менять ее можно.
+Это делается с помощью константной ссылки:
+
+```cpp
+double sum(const vector<double>& xs) { ... }
+```
+
+При передаче параметров нетривиального типа (не `int`, `double` и т. п.),
+в том числе при передаче `std::vector<T>` и `std::string`,
+рекомендуется по умолчанию использовать константную ссылку.
+
+## Выходные параметры функций через указатели и ссылки
+
+Составим функцию для решения квадратного уравнения в действительных числах.
+Очевидно, что она принимает коэффициенты уравнения.
+Возвращает она три значения:
+* признак, что действительные решения есть;
+* корень `x1`;
+* корень `x2`.
+
+Однако у функции возвращаемое значение только одно, допустим, признак.
+Как вернуть корни?
+
+Можно сделать это через ссылки:
+
+```cpp
+bool solve(double a, double b, double c, double& x1, double& x2) {
+    auto d = b*b - 4*a*c;
+    if (d < 0) {
+        return false;
+    }
+    x1 = (-b + sqrt(d)) / 2*a;
+    x2 = (-b - sqrt(d)) / 2*a;
+    return true;
+}
+```
+
+Вызов функции будет выглядеть так:
+
+```cpp
+double x1, x2;
+if (solve(3, 2, 1, x1, x2)) {
+    cout << "x1 = " << x1 << "\n"
+         << "x2 = " << x2 << "\n";
+} else {
+    cout << "Нет действительных корней.\n";
+}
+```
+
+Можно было бы использовать указатели:
+
+```cpp
+bool solve(double a, double b, double c, double* x1, double* x2) {
+    auto d = b*b - 4*a*c;
+    if (d < 0) {
+        return false;
+    }
+    *x1 = (-b + sqrt(d)) / 2*a;
+    *x2 = (-b - sqrt(d)) / 2*a;
+    return true;
+}
+```
+
+Вызов функции будет выглядеть так:
+
+```cpp
+double x1, x2;
+if (solve(3, 2, 1, &x1, &x2)) {
+    cout << "x1 = " << x1 << "\n"
+         << "x2 = " << x2 << "\n";
+} else {
+    cout << "Нет действительных корней.\n";
+}
+```
+
+Какой вариант лучше и почему?
+
+В случае с указателями в функцию мог бы быть передан нулевой указатель:
+
+```cpp
+solve(3, 2, 1, nullptr, &x2);
+```
+
+Программа успешно компилировалась бы, но при запуске аварийно завершилась,
+поскольку в функции `solve()` был бы разыменован нулевой указатель `x1`.
+
+Может показаться, что из-за этого вариант с указателями хуже:
+функция должна проверять, что ей не передали нулевой указатель,
+а со ссылками этого не потребовалось бы — ведь «нулевых ссылок» нет.
+Однако наличие особого значения у указателя — не только проблема,
+но и возможность связать с этим значением особую логику.
+Например, функция могла бы быть реализована так:
+
+```cpp
+bool solve(double a, double b, double c, double* x1, double* x2) {
+    auto d = b*b - 4*a*c;
+    if (d < 0) {
+        return false;
+    }
+    if (x1) {
+        *x1 = (-b + sqrt(d)) / 2*a;
+    }
+    if (x2) {
+        *x2 = (-b - sqrt(d)) / 2*a;
+    }
+    return true;
+}
+```
+
+Теперь, если передать в функцию `nullptr` в качестве `x1` или `x2`,
+она не будет вычислять соответствующий корень.
+Таким образом программа может сэкономить вычисления,
+если оба корня ей заведомо не нужны.
+Можно даже передать `nullptr` в качестве и `x1`, и `x2`,
+тогда функция просто проверит, есть ли действительные решения —
+возможно, конкретной программе, которая использует `solve()`,
+только это и нужно.
+
+Вывод: использовать для передачи выходных параметров указатели или ссылки
+зависит от того, нужна ли дополнительная гибкость логики,
+которую дает наличие особого значения — нулевого указателя.
+
+Заметим, что некоторые проекты предпочитают всегда использовать указатели,
+даже если предполагается, что они обязаны не быть `nullptr` никогда.
+Причина в том, что в случае ссылок по вызову `solve(a, b, c, x1, x2)`
+невозможно определить, какие из переменных после этой строки могут поменяться.
+Вызов же `solve(a, b, c, &x1, &x2)` ясно показывает,
+что `solve()` может поменять `x1` и `x2`.
+
+## Структуры
+
+Структура — это пользовательский тип данных,
+представляющий собой совокупность именованных полей различных типов.
+
+Структуры удобны для того, чтобы сгруппировать несколько переменных,
+которые используются в программе совместно.
+Например, в задаче ЛР № 1 можно было бы объединить входные данные в структуру:
+
+```cpp
+struct Input {
+    std::vector<double> numbers;
+    size_t bin_count;
+};
+```
+
+Здесь `Input` — имя структуры, а `numbers` и `bin_count` — её поля.
+
+Важно понять, что определение выше описывает тип данных (аналог `std::vector`
+или `std::string`), а не переменную, то есть код выше не описывает переменные
+`numbers` и `bin_count`, куда можно сохранить значения. Он описывает,
+что каждая переменная типа `Input` содержит поля `numbers` и `bin_count`,
+в которые уже можно сохранить конкретные данные.
+
+Переменные типа структур объявляются так же, как переменные других типов;
+именем типа выступает имя структуры:
+
+```cpp
+Input x;
+```
+
+Говорят, что переменная `x` — экземпляр структуры.
+
+К полям структуры обращаются через точку:
+
+```cpp
+cout << x.numbers.size(); // 0
+cin >> x.bin_count;
+if (x.bin_count == 0) { ... }
+```
+
+Можно объявить несколько переменных типа структуры:
+
+```cpp
+Input y;
+Input z;
+
+y.bin_count = 3;
+z.bin_count = 4;
+```
+
+Значения, хранимые в `x`, `y` и `z` будут независимы друг от друга.
+
+### Инициализация полей
+
+Вернемся к объявлению `x`, чему было равно `x.bin_count` до её ввода?
+Так как в определении структуры
+для поля `bin_count` не было указано значения по умолчанию,
+то и конкретное начальное значение `x.bin_count` не определено.
+
+Удобно, чтобы у всех полей были начальные значения.
+Например, так можно инициализировать нулем `bin_count`
+любой новой переменной типа `Input`:
+
+```cpp
+struct Input {
+    vector<double> numbers;
+    size_t bin_count{}; // или size_t bin_count = 0;
+};
+```
+
+Как известно, переменные типа `vector<T>` по умолчанию содержат пустой вектор,
+поэтому для поля `numbers` о начальном значении заботиться не нужно.
+
+### Оператор «стрелка» (`->`)
+
+На переменные типа структуры могут быть указатели:
+
+```cpp
+Input* p = new Input;
+```
+
+Чтобы использовать оператор `.` для доступа к полям структуры,
+на которую указывает `p`, нужно сначала разыменовать `p`.
+Оператор `.` имеет наивысший приоритет, поэтому нужны скобки: `(*p).bin_count`.
+Это громоздко, поэтому в C++ введено оператор «стрелки» `->`,
+чтобы записать то же самое проще: `p->bin_count`.
+
+## Перегрузка функций
+
+Можно объявить набор функций с одинаковыми именами, но разными сигнатурами:
+
+```cpp
+// print(3.14) -> 3.14
+void print(double x) {
+    cout << x;
+}
+
+// print({1, 2, 3}) -> {1, 2, 3};
+void print(const std::vector<double>& xs) {
+    cout << "{";
+    bool need_comma = false;
+    for (auto x : xs) {
+        if (need_comma) {
+            cout << ", ";
+        } else {
+            need_comma = true;
+        }
+        print(x);  // вызов print(double), а не рекурсия
+    }
+    cout << "}";
+}
+```
+
+Говорят, что функция `print()` *перегружена (overloaded),*
+а каждая из конкретных функций называется её *перегрузкой.*
+Когда компилятор встречает вызов `print()`, он анализирует типы параметров
+и вызывает соответствующую перегрузку.
+
+Перегрузки бывают полезны в обобщенном коде,
+то есть таком, который готов работать с различными типами данных.
+Об это будет рассказано на последующих лекциях.
+
+## Объявление и определение функции
+
+Будет ли компилироваться программа такого вида?
+
+```cpp
+void foo() {
+    bar();
+}
+
+void bar() {
+    foo();
+}
+```
+
+Функция `foo()` вызывает функцию `bar()` раньше, чем она описана,
+что вызовет ошибку.
+Однако перенести описание `bar()` выше описания `foo()` нельзя:
+`bar()` содержит вызов `foo()`, который тогда окажется выше,
+чем описана `foo()`.
+
+Рассуждая логически, для того, чтобы скомпилировать `foo()`,
+компилятору не нужно тело функции `bar()` — достаточно знать,
+что такая функция есть, и какие у нее параметры (нет параметров).
+Сообщить компилятору о сигнатуре функции можно с помощью
+*объявления функции (declaration)*.
+В отличие от уже знакомого *определения функции (definition),*
+объявление не содержит тела, а кончается точкой с запятой:
+
+```cpp
+void bar();     // объявление bar()
+
+void foo() {
+    bar();      // вызов bar()
+}
+
+void bar() {    // определение bar()
+    foo();
+}
+```
+Объявления и определения важны при делении программы на файлы.