Book: Теория метода конечных элементов



AN ANALYSIS OF THE FINITE ELEMENT METHOD Gilbert Strang Massachusetts Institute of Technology George J. Fix University of Maryland t>RENTICE-HALL, INC. Englewtfod Cliffs, N. J. 1973

Г. СТРЕНГ, ДЖ. ФИКС ТЕОРИЯ МЕТОДА КОНЕЧНЫХ ЭЛЕМЕНТОВ Перевод с английского .В. И. АГОШКОВА, В. А. ВАСИЛЕНКО, В. В. ШАЙДУРОВА Под редакцией Г. И. МАРЧУКА ИЗДАТЕЛЬСТВО „МИР" МОСКВА 1977

УДК 519.3 Метод конечных элементов получил в последнее время широ- широкое распространение как один из современных и самых эффектив- эффективных методов решения краевых задач математической физики. В монография известных американских специалистов излагаются теоретические основы метода конечных элементов — интерполяция данных, выбор аппроксимирующих функций, модификация крае- краевых условий, точность вычислений. Обсуждаются возможности применения в различных областях физики и техники, приводятся простые примеры для иллюстрации теоретических положений- Книга доступна студентам и аспирантам университетов и вту- втузов. Специалисты по численным методам найдут в ней большой фактический материал по практическому применению метода ко- конечных элементов. Редакция литературы по математическим наукам Original English language edition published by Prentice-Hall, Inc Englewood Cliffs, New Jersey, U.S.A. Copyright © 1973 by PRENTICE-HALL, INC. С 20203-027 7? [email protected]) — 77 © Перевод на русский язык, «Мир», 1977

ОТ РЕДАКТОРА ПЕРЕВОДА В течение последних десяти лет метод конечных элементов превратился в мощную математическую основу для создания пакетов программ решения задач математической физики, по- позволяющих полностью автоматизировать процесс, построения и решения систем вариационно-разностных уравнений. Книга, предлагаемая Вашему вниманию, написана двумя из- известными американскими математиками — Гилбертом Стренгом и Джорджем Фиксом. Их работа — попытка наметить связь между инженерной теорией конечных элементов и математиче- математической основой метода. Этим объясняются особенности стиля книги, а также простота примеров, на которых рассматривается метод и иллюстрируются основные идеи. Вместе с тем в книге присутствуют все математические доказательства, необходимые для четкого обоснования оценок сходимости. Круг рассматри- рассматриваемых задач весьма широк — эллиптические и параболические задачи, задачи на собственные значения. При этом не только обсуждаются теоретические вопросы, но и даются практические вычислительные рекомендации. Книга снабжена обширной би- библиографией. Для чтения книги достаточно владеть математическим ана- анализом в рамках программы технического вуза. Все дополнитель- дополнительные математические понятия вводятся непосредстенно в тексте или в конце книги. Книга будет полезна как специалистам, работающим в обла- области прикладной и вычислительной математики, так и инженерам и студентам вузов, желающим ознакомиться с этим популярным сейчас вычислительным методом решения различных научных и технических проблем — методом конечных элементов. Эта книга будет способствовать развитию и применению современных вы- вычислительных методов. Г. И.Марчук Май 1976

ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Я очень рад и очень горжусь тем, что эта книга переведена на русский язык. Вы, конечно, знаете и без нашей книги, что метод конечных элементов продолжает свое стремительное развитие не только как «красивая теория», но и как очень прак- практический вычислительный метод решения прикладных задач. Расширяются его применения в строительной механике и гидро- гидромеханике, рождаются новые области применений. Вероятно, ко- конечные элементы стали наиболее употребительным средством вычислительной математики во всем мире; это хорошо, но будет еще лучше, если мы научимся решать те же задачи с меньшими затратами. Я уверен, что метод будет развиваться дальше, и надеюсь, что Вы поможете этому и настоящая книга также. Ее цель — разъяснить основные идеи метода настолько просто и ясно, чтобы инженеры смогли строить и применять конечные эле- элементы, а специалисты по численному анализу увидели вопросы, которые их касаются, и чтобы те и другие нашли общий язык! Предмет книги очень многим обязан русским математикам и прежде всего Галёркину и Михлину. Идея использования ку- кусочно полиномиальных функций — это новый шаг, но шаг прямо по пути, намеченному их фундаментальными работами. Благо- Благодаря этому шагу метод перестал быть чисто теоретическим и сделался чрезвычайно практическим. Сейчас появились другие книги по конечным элементам, не- некоторые из них хороши для инженеров, но эта остается для меня самой любимой.. Надеюсь, она Вам понравится. Гилберт Стренг Октябрь 1975

Джилл и Линде Cherche la f. e. m.') ПРЕДИСЛОВИЕ Метод конечных элементов удивительно успешно применя* ется в самых различных задачах. Он был создан для решения сложных уравнений теории упругости и строительной механики и оказался гораздо эффективнее метода конечных разностей. Сейчас активно разрабатываются и другие применения метода конечных элементов. Этот метод незаменим, если нужно учиты* вать геометрические особенности областей — тогда ЭВМ исполь* зуется не только для решения системы уравнений, но в первую очередь для формулирования и построения дискретных аппро- аппроксимаций. С математической точки зрения метод представляет собой обобщение метода Рэлея — Ритца — Галёркина. Поэтому он при* меним к широкому классу уравнений в частных производных. В методе Ритца, однако, не решается непосредственно диффе*. ренциальное уравнение; вместо этого исходная задача представ-' ляется в эквивалентной вариационной формулировке, а затем ищется приближенное решение последней в виде комбинат ции2]<7/Ф/ заданных пробных функций qpj(jt). При этом весовые коэффициенты qs вычисляются из вариационного принципа, со- соответствующего задаче. Это и есть та система дискретных урав- уравнений, котора» решается с помощью ЭВМ. Эта идея очень стара. Новым является лишь выбор пробных функций: в методе конечных элементов они кусочно полино- полиномиальны. Именно этим выбором определяется успех метода. Каждая функция ср.,- равна нулю на большей части области и отлична от нуля только в окрестности одного узла. В этой окрест-* ности ерь,- составлена из полиномов небольшой степени, й все вычисления становятся максимально простыми. Интересно, что преимущества кусочно полиномиальных функций одновременно и совершенно независимо были замечены в математической тео- теории аппроксимации. Идея их применения оказалась весьма пло- плодотворной, и она появилась как раз в нужное время. Поскольку математическая основа метода построена, можно' показать, почему он работает; этому и посвящена наша книга. ') f. е. т. — сокращение для метода конечных элементов. —-Прим. перев.

8 предисловие Ее цель — объяснить влияние различных факторов на вычисли- вычислительную эффективность метода конечных элементов. Мы пере- перечислим здесь основные факторы: 1) интерполяция физических данных, 2) выбор конечного числа полиномиальных пробных функ- функций, 3) упрощение геометрии области, 4) модификация краевых условий, 5) численное интегрирование функционала в вариационном принципе, 6) ошибки округления при решении дискретной системы. Эти вопросы в основном являются математическими, и ав- авторы этой книги — математики. Тем не менее не надо думать, что эта книга предназначена исключительно для специалистов по численному анализу. Напротив, мы надеемся, что она помо- поможет установлению более тесных связей между инженерами- математиками и математиками-аналитиками. Нам кажется, что метод конечных элементов обеспечивает благоприятную возмож- возможность укрепления таких связей: теория весьма привлекательна, приложений становится все больше и, что самое главное,, метод еще достаточно молод и разрыв между теорией и практикой не стал еще непреодолимым, Конечно, мы сознаем, что существуют помехи, которые нельзя устранить полностью. Одна из них — язык изложения: мы свели математические обозначения до минимума и вынесли их (вместе с определениями) в конец книги. Однако мы хорошо понимаем, что даже после интерпретации нормы как естествен- естественной меры энергии деформации, а гильбертова пространства как класса допустимых функций, в вариационной задаче физиче- физического происхождения остается самое трудно^ — свыкнуться с этими понятиями, сделать их своими собственными. Здесь на- наряду с совместными усилиями требуется настойчивость и терпи- терпимость с обеих сторон. Возможно, эта книга по меньшей мере вы- выявит такие задачи, которые математик уже умеет решать, и та- такие, для которых он бесполезен. В последние несколько лет очень многие специалисты по чис- численному анализу стали заниматься методом конечных элемен- элементов, и мы им весьма благодарны. Это подтверждается явно на протяжении всей книги и неявно в библиографии, хотя мы не имели намерения создавать формальную историю метода. Здесь, ¦ в предисловии, мы хотим поблагодарить двух коллег — скорее инженеров, чем математиков — за помощь, особенно важную для нас. Первый — Айзек Фрид, влияние которого заставило нас отказаться от публикации законченной рукописи «Fourier Ana- Analysis of the Finite Element Method» и заняться этой книгой. Вто-

ПРЕДИСЛОВИЕ 9 рой — Брюс Айронс, замечательные интуитивные соображения которого описаны (и доказаны строго, где мы смогли это сде- сделать) в нашей книге. Глава 1 существенно длиннее всех остальных. Она использо- использовалась первым автором в качестве вводного курса в Массачу- сетском технологическом институте. В качестве домашнего зада- задания предлагалось запрограммировать некоторые виды конечных элементов. Там, где такие программы имеются, следует совме- совмещать численные эксперименты с теоретическим семинаром, ос- основанным на этой книге. Главы 2—5 написаны первым автором. Последние три главы написаны вторым автором, а затем редактировались и «унифи- «унифицировались» первым. Весь текст был отпечатан миссис Ингрид Нааман, любезность которой заставила нас поверить, что она делала это с удовольствием. Благодарим за внимание. Гилберт Стренг Джордж Дж. Фикс Кембридж, Массачусетс

1 ВВЕДЕНИЕ В ТЕОРИЮ 1.1. ОСНОВНЫЕ ИДЕИ Метод конечных элементов можно описать несколькими сло- словами. Предположим, что задача, которую нужно решить, постав- поставлена в вариационной форме: требуется найти функцию и, мини- минимизирующую заданный функционал потенциальной энергии. Необходимость минимизации приводит к дифференциальному уравнению для и (уравнению Эйлера), которое обычно нельзя решить точно и приходится применять приближенные методы. Идея метода Рэлея — Ритца— Галёркина состоит в том, что выбирается конечное число пробных, функций qpi, фг, ..., срлг и среди всех линейных комбинаций вида 2^ф, ищется комбина- комбинация, доставляющая минимум функционалу. Это аппроксимация Ритца. Неизвестные веса <7j определяются уже не из дифферен- дифференциального уравнения, а из системы N дискретных алгебраиче- алгебраических уравнений, для решения которой можно применить ЭВМ. Теоретическое обоснование этого метода очень простое: процесс минимизации автоматически дает комбинацию, ближайшую к функции и. Таким образом, цель состоит в том, чтобы выбрать пробные функции фз достаточно удобными для вычисления и ми- минимизации потенциальной энергии и в то же время обеспечить хорошее приближение неизвестного решения и. Наибольшая трудность при этом — достижение удобства и простоты вычислений. Теоретически всегда существует полный базис из пробных функций: их линейные комбинации при N -> оо приближают любой элемент пространства и потому ап- аппроксимация Ритца сходится. Но можно ли будет численно ра- работать с этими функциями — вот в чем вопрос. Именно этим вопросом и занимается теория конечных элементов. . Основополагающая идея весьма проста. Все начинается с разбиения исходной области на мелкие куски. Структура их должна быть проста для хранения и опознавания с помощью ЭВМ. Это могут быть треугольники или прямоугольники. Затем внутри.каждого элемента разбиения задается пробная функция в максимально простой форме — обычно это полином, как пра- правило, третьей или четвертой степени. Краевые условия гораздо проще поставить вдоль стороны треугольника или прямоуголь- прямоугольника, чем сразу на всей границе области. Точность приближе-

12 1, ВВЕДЕНИЕ В ТЕОРИЮ ния повышается, если необходимо, не как в классическом ме- методе Ритца за счет использования более сложных пробных функ- функций, а за счет более мелкого разбиения области с сохранением тех же полиномов, что и прежде. ЭВМ при этом работает по той же программе, только дольше. При применении метода ко- конечных элементов вычислительная машина помогает не только решать разностные уравнения, но и строить их, чего никогда прежде не было в случае сложных физических задач. Метод конечных элементов придумали инженеры, и поначалу он не'был понят как вариант метода Рэлея — Ритца. Разбиение области на простые части и составление уравнений равновесия и неразрывности для этих частей были выполнены на основе физических соображений. Построение более сложных конечных элементов проводилось так же; было замечено, что при возра- возрастании степени полиномов значительно повышается точность, однако неизвестные коэффициенты qp вычисляемые при дискрет- дискретной аппроксимации, всегда имели некий физический смысл. По этой причине результат было гораздо легче интерпретировать, чем весовые коэффициенты в классическом методе. Вся эта процедура стала математически обоснованной, когда неизвестные коэффициенты q, были отождествлены с коэффици- коэффициентами в аппроксимации Ритца "»Х<7/Ф/> а дискретные урав- уравнения — с условиями минимума потенциальной энергии. Это по- поняли Аржирис в Германии и Англии, Мартин и Клаф в Аме- Америке; мы не знаем, кто из них первый. В результате появилась возможность заложить теоретическую основу метода. Процедуры построения более точных конечных элементов уже были разра- разработаны, теория стала вырисовываться. Основная задача состоит в исследовании точности, с которой кусочно полиномиальные функции могут аппроксимировать неизвестное решение и. Другими словами, надо определить, на- насколько хороши конечные элементы, построенные на основе вы- вычислительной простоты, и дадут ли они хорошую аппроксима- аппроксимацию. Интуитивно ясно, что всякую достаточно хорошую функ- функцию и можно с произвольной точностью приблизить кусочно линейными функциями. Математическая задача состоит в полу- получении максимально точной оценки ошибки и определении скоро- скорости убывания ошибки при возрастании количества элементов разбиения (или степени полинома внутри каждого элемента). Разумеется, метод конечных элементов можно применять, не доказывая математические теоремы; так делали в течение более десяти лет. Однако мы считаем, что полезно, особенно для даль- дальнейшего развития метода, понять и обобщить все, что уже сде- сделано. Мы попытаемся дать полный анализ линейных задач и ме- метода перемещений. Подобной теории-для нелинейных уравнений

1.2. ДВУХТОЧЕЧНАЯ КРАЕВАЯ ЗАДАЧА 13 пока не существует, хотя можно рассмотреть полулинейные уравнения, в которых нелинейность содержится в членах млад- младшего порядка. Мы сделаем несколько предварительных замеча- замечаний о нелинейных уравнениях, но в основном оставим эти за- задачи на будущее. Почему мы выбрали именно метод перемеще- перемещений, а не другую вариационную формулировку, мы поясним б гл. 2; здесь мы встали на сторону большинства. Это наиболее распространенный взгляд на метод конечных элементов. Разу- Разумеется, можно было бы построить теорию аппроксимации в дру- других терминах, но переход от одной теории к другой был бы почти автоматическим. Цель настоящей главы — иллюстрация основных этапов в ме- методе конечных элементов: 1. Вариационная постановка задачи. 2. Построение кусочно полиномиальных пробных функций. 3. Вычисление матрицы и решение дискретной системы. 4. Оценка точности аппроксимации Ритца. Мы ограничиваемся вариационной постановкой задачи, чтобы можно было использовать некоторые важные математические понятия, необходимые для нашей теории — гильбертовы прост- пространства Ж5, оценки решения по исходным данным, энергетиче- энергетическое скалярное произведение, которое естественно связано со спецификой задачи. С помощью этого аппарата можно доказать сходимость метода конечных элементов даже в очень сложной геометрии. ~Фактически простота вариационного подхода позволяет ана- анализировать то, что уже недоступно методу конечных разностей. 1.2. ДВУХТОЧЕЧНАЯ КРАЕВАЯ ЗАДАЧА Мы поясним метод конечных элементов и введем необходи- необходимый математический аппарат на хорошо известном примере. Возьмем' одномерное пространство, чтобы конструкция элемен- элементов была проста и естественна, а математические преобразова- преобразования вели прямо к цели — требуется всего лишь интегрирование по частям вместо использования общих формул Грина. Итак, мы выбираем уравнение () </М« = Ш. (О Если поставить подходящие краевые условия в точках х = 0 и х = п, то получим классическую задачу Штурма — Лиувилля. Это уравнение описывает ряд различных физических процессов, например распределение температуры в некотором стержне или амплитуду колебаний струны. В пространстве большей



14 I, ВВЕДЕНИЕ В ТЕОРИЮ размерности это соответствует эллиптической краевой задаче, например уравнению Лапласа. Для того чтобы проиллюстрировать различные типы краевых условий, особенно при вариационной постановке задачи, мы фиксируем левый конец струны, а правый оставляем свободным. Таким образом, в точке х = 0 краевое условие является глав- главным (кинематическим, вынужденным, геометрическим), или ус- условием Дирихле ы@) = 0, а в точке х = п, где струна не закреплена, возникает естествен- естественное (динамическое) краевое условие, или условие Неймана и'(л) = 6. Исследуем эту модельную задачу с четырех различных точек зрения: 1) чисто математической, 2) прикладной, 3) с точки зрения аппроксимации конечными разностями, .4) с точки зрения аппроксимации конечными элементами. Важно увидеть в этих четырех аспектах одной и той же за- задачи общие черты: средства, применяемые математиком для до- доказательства существования и единственности решения, а вычис- вычислителем при численном анализе поведения решения, следует применить также при изучении численного алгоритма. Сначала поступим, как математик, скомбинировав дифферен- дифференциальное уравнение и краевые условия в одно целое: Lu = f. Здесь L — линейный оператор, действующий на определенном классе функций, а именно удовлетворяющих краевым условиям и дважды дифференцируемых. С математической точки зрения основная задача такова: подобрать пространство функций и и класс правых частей f так, чтобы каждой функции f соответ- соответствовало единственное решение и. Как только соответствие между f vi и установлено, задача Lu = f в абстрактном смысле «решена». Разумеется, это лишь первый шаг в определении ре- решения и, соответствующего данной функции f. Эта задача со- составляет предмет всей книги. Однако мы считаем, что стоит по- потратить время на определение таких функциональных про- пространств. При использовании вариационных принципов и ап- аппроксимации особенно важно знать точно, на каком функцио- функциональном пространстве они применимы. (Термин «пространство» предполагает линейность.)

1.2. ДВУХТОЧЕЧНАЯ КРАЕВАЯ ЗАДАЧА 1б Рассмотрим одно такое пространство, по-видимому, наиболее важное в теории, а именно пространство функций с конечной энергией, т. е. функций f, для которых п \(f(x)fdx<°o. ¦ B) о Любая кусочно гладкая функция f принадлежит этому прост- пространству, но б-функция Дирака — уже нет. Позже мы вернемся к этому случаю «сосредоточенной нагрузки». Пространство функций, удовлетворяющих условию B), часто обозначают L2. Мы предпочитаем обозначение 5#°. Здесь верхний индекс указы- указывает, сколько производных от функции f обладают конечной энергией (в нашем случае конечной энергией обладает только сама функция f). Для простейшей задачи Штурма — Лиувилля — и" = f не- нетрудно построить соответствующее пространство решений. Та- Такое пространство обозначается.Ж\. Нижний индекс В означает, что выполнены краевые условия ы@) = и'(л) = 0, а верхний индекс 2 — что вторая производная решения и обладает ко- конечной энергией1). Можно показать, однако, что если предпо- предположить р(х)^ ршь > 0 и q(x)^0, то пространство Ж% будет к тому же пространством решений более сложного уравнения — (ри')' rf- qu = f. Итак, справедлива теорема: Оператор L есть взаимно однозначное отображение из Ж% в Жй. Таким образом, для всякой функции f e Жй диффе- дифференциальное уравнение A) имеет единственное решение и в Ж\. Более того, решение непрерывно зависит от f: если функция f мала, то мало и решение и. Последнее замечание требует разъяснения. Нам нужны нор- нормы, с помощью которых можно измерять f и и. Нормы должны 'быть различными, так как различны пространства правых ча- частей и решений- Естественно связать эти нормы с энергией: II и ||2 = [f ((«" МJ + («' (х)J + (и МJ) dxf. Пользуясь этими определениями, можно записать непрерывную зависимость решения от входных данных в количественной фор- форме: существует такая постоянная С, что C) *) Эти пространства определены в указателе обозналеций в конце книги.

16 1. ВВЕДЕНИЕ В ТЕОРИЮ Из этой оценки немедленно следует единственность решения: если f = 0, то и и = 0. Такие оценки лежат в основе современ- современной теории уравнений в частных производных. Общая методика доказательства неравенства C), которую можно применять для краевых задач в пространствах нескольких переменных, развита совсем недавно.' В этой книге мы будем использовать такие оценки для эллиптических уравнений порядка 2т: 1|и||2«<С||Л|о. ^ D) Перейдем к более практическому вопросу — явному построе- построению решения. Если коэффициенты р и q постоянны, то решение можно построить в виде бесконечного ряда. Ключ к решению дает то обстоятельство, что собственные значения и собственные функции оператора L известны в явной форме: ««(*) = Д/у sin(n—-i-)*, /\,„ = р(п ~уJ + <7- E) Ясно, что Lun= — ри" -f- qun = Knun, функции ип удовлетворяют кат в Ж\ и ортон ип (х) ит (х) dx = Ьп краевым условиям, лежат в Ж\ и ортонормальны: л 0 Предположим, что правая часть разложена в ряд по собствен- собственным функциям: f (х) = ? ап д/f sin (n -1) х. F) Формально интегрируя ряд и учитывая ортогональность ы„, по- получаем Я оо Функция f из Ж0 допускает точное гармоническое разложение в форме F), и коэффициенты разложения удовлетворяют усло- условию 2jart<°°- Здесь возникает небольшой парадокс, так как каждая функция f в форме F) формально удовлетворяет усло- условиям [email protected]) = 0, f'(n) = 0, хотя никаких краевых условий на / не налагается. От элементов из Ж0 требуется лишь конечная энергия, w2 < оо. Этот парадокс исчезает, если использовать полноту собственных функций ип в Ж0. Независимо от того,

1.2. ДВУХТОЧЕЧНАЯ КРАЕВАЯ ЗАДАЧА удовлетворяет ли f этим фальшивым краевым условиям, ее раз- разложение сходится в среднем квадратичном: N .. 2 п-\ Таким образом, эти краевые условия нестойки и при N-*oo «снимаются». На рис. 1.1 показано, как сходится последова- последовательность функций /„, лежащих в Ж%, к функции f, не лежащей в Ж\. 'N x = О х =Я Рис. 1.1. fN в 3&| аппроксимирует произвольную функцию f. Теперь ясно, как решать дифференциальное уравнение Штур- Штурма— Лиувилля: если f = ^апиП) то решение и представимо в виде ряда G) Используя это явное решение, можно непосредственно получить оценку || и |Ь ^ С || f Но и, таким образом, связь между прост» ранством данных Ж0 и пространством решений Ж%. Вопрос о краевых условиях сложнее и заслуживает дальней- шего рассмотрения. Мы уже видели, что хотя f приближается ря- рядом по функциям ип, удовлетворяющим краевым условиям, это еще не значит, что f удовлетворяет им. Почему же решение и подчинено краевым условиям? Дело в том, что разложение в ряд для функции и сходится в более сильном смысле, чем разложение для фуЯкццй.-./Гlie. Ty}M0 Л ицяк/К сходится к М

18 I. ВВЕДЕНИЕ В ТЕОРИЮ в среднем квадратичном, но сходятся первые и вторые производ- производные этого разложения. Точнее, при ЛГ->оо. Смысл в том, что когда сходятся вторые производные, краевые условия сохраняются и предельная функция и также им удов- удовлетворяет. (Заметим, что на рис. 1.1 вторые производные от fN не сходятся к f", поэтому f не удовлетворяет краевым условиям и не лежит в Ж\. Однако подобная ситуация невозможна для и.) Общее правило таково: краевые условия, включающие про- производные порядка менее s, сохраняются при предельном пере- переходе в норме пространства Ж8. Краевые условия с производ- производными порядка s и выше нестойки, и их нельзя применить к функциям пространства Ж*. Теперь понятно различие между главными краевыми условиями, которые остаются, и естествен- естественными краевыми условиями, которые меняются. Это различие видно в вариационной задаче, так как она записывается в тер- терминах первых призводных, _т. е. ^'-нормы. В аппроксимации по методу конечных элементов мы будем требовать удовлетво- удовлетворения всех краевых условий, содержащих производные порядка менее 1, т. е. условия типа ы@) = 0, но не будем требовать удовлетворения условия на первую производную. Это не поме- помешает аппроксимации по методу конечных элементов сходиться в .З^'-норме к точному решению и, удовлетворяющему условию и'(л) = 0. Поэтому в следующем разделе мы сможем перейти от «чисто математической» постановки задачи к эквивалентной вариационной постановке. 1.3. ВАРИАЦИОННАЯ ПОСТАНОВКА ЗАДАЧИ Линейное уравнение Lu = f связано с квадратичным функци- функционалом \ = (Lv, v)-2(f, и) следующим образом: уравнение Lu = f есть уравнение Эйлера; оно дает условие минимизации функционала /. Задачи обраще- обращения оператра L и минимизации функционала / эквивалентны и решением для них служит одна и та же функция и. По этой причине можно ставить задачи как в' операторной форме — в терминах линейного-оператора L, так и в вариационной фор- форме— в терминах квадратичного функционала /. Цель этого раз- раздела — найти точный вариационный эквивалент нашей двухто- двухточечной краевой задачи.

У 1.3. ВАРИАЦИОННАЯ ПОСТАНОВКА ЗАДАЧИ 19 Эквивалентность дифференциальных уравнений и вариацион- вариационных задач составляет основу выбора вычислительной _схемы. Дифференциальное уравнение можно аппроксимировать дискрет- дискретной системой, используя конечные разности, а" вариационный функционал можно минимизировать на конечномерном про- пространстве функций, как в методе конечных элементов. В прило- приложениях вариационная постановка часто бывает первичной и сле- следует из физических соображений, а дифференциальное уравне- уравнение — результат такой постановки. Неудивительно поэтому, что нас интересует прежде всего, как приближенно минимизировать квадратичные функционалы. Функционал мы называем квадратичным по аналогии со слу- случаем, когда L, v и f — просто вещественные числа. Тогда I(v)=Lv2 — 2fv описывает параболу, и, если число L положи- положительно, она достигает минимума в точке и, определяемой из уравнения Если L •< 0, то минимум равен —,оо, а если L = 0, то пара- парабола вырождается в прямую. Более интересен случай, когда v и f — это л-мерные векторы, a L—симметричная положительно определенная матрица по- порядка п. Функционал / имеет вид , /(и)=Е Ljkvkvl — 2 С учетом симметрии Ljk = Lkj уравнения Эйлера запишутся так: дщ Эти уравнения дают вместе систему Lu = f. Минимум функцио- функционала /, достигаемый на векторе и = Lrlf, равен i(j-xi\ — (f г~1Л off T-if) — (f'f~xf\ (Запись (,) означает обычное скалярное произведение векто- векторов.) Так как матрица L положительно определена, то L~x тоже положительно определена, и этот минимум отрицателен (или ра- равен нулю, если / = 0). Геометрически I(v) представляется вы- выпуклой поверхностью, причем параболоид будет выпуклым вниз, если матрица L положительно определена. Уравнение минимума Lu — f получается при одновременном варьировании всех компонент.

20 Г. ВВЕДЕНИЕ В ТЕОРИЮ Если и— точка минимума для /, то для всех v и е ' / (и) < / (и + во) = / (и) + 2е [(Lu, v) - (f, v)} + e2 (Lv, v). Так как число е может быть произвольно мало и иметь любой знак, коэффициент при е должен обратиться в нуль: (Lu, &) = (/, у) для всех и. (8) Отсюда следует, что Lu = f. Будем называть уравнение (8) уравнением в слабой форме или уравнением Галёркина. При со- составлении таких уравнений не надо требовать положительной определенности оператора L или его симметрии, так как урав- уравнения Галёркина — это услбвия не минимума, а всего лишь ста- стационарной точки. Такая постановка задачи приводит к методу Галёркина. Разумеется, кроме функционала (Lv, v)—2(f, v), сущест- существуют и другие квадратичные функционалы, точкой минимума которых служит решение уравнения Lu = f. Очевидно, что функционал метода наименьших квадратов Q(v) = (Lv — f, Lv — f) достигает минимума (равного нулю) в той же точке. Есть, однако, существенное различие: уравнения Эйлера dQ/dvm = 0 приводят не к Lu = f, а к LTLu = LTf. Теоретиче- Теоретически эти уравнения эквивалентны, если оператор L обратим, но на практике появление LTL невыгодно. Рассмотрим теперь наше дифференциальное уравнение Построим I(v) = (Lv, v) — 2(f,v). Скалярное произведение оп- определено здесь для функций, заданных в интервале О^лг^п, но оно очень похоже На скалярное произведение векторов: л (lv) = \f(x)v(x)dx. о Функции f, v вещественны, как в большинстве приложений. Мо- Модификация на комплексный случай хорошо известна: над одним из сомножителей в интеграле надо поставить знак сопряжения. Функционал / вычисляется интегрированием по частям (этот прием широко применяется в теории дифференциальных опера- операторов) : я я {Lv, v)=\[- (pv')' + qv] v dx - \ [p {vj + qv*\ dx - pv'v \ (9) A J о

1.3. ВАРИАЦИОННАЯ ПОСТАНОВКА ЗАДАЧИ 21 Если v удовлетворяет краевым условиям [email protected]) = v'(n) = 0, то квадратичный функционал принимает вид я /(»)-$&* (*) («' (х)K + q (x) (v (x)f - 2/ (х) v (х)} dx. о Этот функционал и нужно минимизировать. Решение дифференциального уравнения Lu = f соответствует функции и, минимизирующей /. На каком классе функций сле- следует искать этот минимум? Мы знаем, что решение и лежит в Ж\. Значит, класс функций должен содержать Ж\. Минимум функционала I(v) на классе Ж\ реализуется в нужной точке v = и. Заметим, однако, что выражение для f(v) не содержит вторых производных, они исчезли при интегрировании по час- частям. Это значит, что I(v) можно определить на функциях v, у которых первая производная, а не вторая, обладает конечной энергией. Следовательно, класс функций, на которых задача минимизации имеет смысл, шире, чем пространство Ж\. Наш принцип таков: функцию v можно включить в класс, на котором мы решаем задачу минимизации, если только v — предел последовательности функций vN из Жв- Под словом «предел» мы понимаем предел в смысле квадратичных членов в выражении потенциальной энергии: я \p{v'-v'Nf+q{v-vNf->Q, N->oo. A0) о Отметим, что такое расширение нашего пространства, действи- действительно, не может уменьшить минимум функционала I; каждое новое значение I(v) есть предел старых значений I(vN). Таким образом, если минимум / уже достигался для какой-то функ- функции и из Ж\, то она останется минимизирующей функцией. Это не вызывает сомнений. Однако у нас теперь огромное пре- преимущество: минимум разрешается искать также и на функциях v, лежащих за пределом исходного класса Ж\. На практике это означает, что можно использовать непрерывные4 и всего лишь кусочно линейные функции — их легко построить и их пер- первые производные обладают конечной энергией, но сами функ- функции не принадлежат Ж\. Наша задача состоит теперь в том, чтобы описать это новое, более приемлемое пространство. Другими словами, мы хотим найти свойство функций v, являющихся пределом в смысле (Ю), т. е. в норме пространства Ж1, последовательности

22 1. ВВЕДЕНИЕ В ТЕОРИЮ функций Улг, имеющих две производные и удовлетворяющих всем краевым условиям. Свойств, которые мы хотим определить, два: гладкость до- допустимых функций и -краевые условия, которым они должны удовлетворять. Первое свойство найти сравнительно просто: так как A0) влечет за собой только сходимость первых произ-, Рис. 1.2. Сходимость в пространстве Ж^\ vN{n) но v водных, предельная функция v должна лежать лишь в Ж1. Это означает, что норма г л Lo 'j'f)dx\ должна быть конечной. Проблема краевых условий — вещь более тонкая. Если не- некоторая последовательность элементов из 26% удовлетворяет условиям у#@) = 0 и v'N{n) = 0, сохранит ли предельная функ- функция оба эти свойства? Оказывается, первое свойство сохра- сохранится, а второе будет потеряно. Чтобы показать, что предел не обязан удовлетворять условию Неймана у'(я) = 0, положим, например, v(x) — x и рассмотрим последовательность {vN} на рис. 1.2. Так как v — vN обращается в нуль всюду, кроме ма- малого интервала на границе, причем 0<^у'— .v'n^, 1. то требова- требование A0), очевидно, выполнено. Таким образом, v(x) = x при- принадлежит предельному пространству допустимых функций, хотя /()?0

1.3. ВАРИАЦИОННАЯ ПОСТАНОВКА ЗАДАЧИ 2S С Другой стороны, условие i>@)=0 продолжает сохра- сохраняться в пределе. Действительно, vN сходится в каждой точке х, так как по неравенству Шварца I vN (x) - vM (x) \2 = \\ (v'N (y) - v'M (y)) dy X <>\\4y\{v'N-v'M)dy->Q. Из анализа известно, что предельная функция v непрерывна и сходимость vN к v равномерна по х. В частности, у@) = = НтУлг@) = 0 в точке х = 0. Другими словами, первые про- производные сходятся только в среднем квадратичном и нет гаран- гарантии, что у'(я) = 0. Итак, пространством функций, допустимых при .минимиза- .минимизации, будет $вхЕ; его элементы имеют первые производные с ко- конечной энергией и удовлетворяют главному краевому условию у@) = 0 (на это указывает нижний индекс Е). Естественное краевое условие у'(я) = 0 не обязательно. Отметим, что, если наши математические рассуждения последовательны, функция и из Ж\, минимизирующая /, автоматически удовлетворяет усло- условию «'(jt) = O. Это легко проверить, так как для некоторого числа е и некоторой функции v из Ж\ л 'v' « + во) = /(«) + 2е \ pu'v' + quv -fv о я Так как число е может быть любого знака, линейный член (пер- (первая вариация) должен отсутствовать: ль 0 = \ pu'v' + quv — fi> 0 л = S [- (pu'Y + qu -f\v + p (n)u'(n) v (л). A1) 0

24 I. ВВЕДЕНИЕ В ТЕОРИЮ Если минимизирующая функция и имеет две производные (так что можно провести последнее интегрирование по частям), пра- правая часть равна нулю для веек v e Же только тогда, когда — (ри')'-{-qu = f и выполнено естественное краевое условие v'(n) = 0 на границе. Точно так же и@) = 0, поскольку, по- подобно всякой другой функции из Же, функция и удовлетворяет главному краевому условию. Это замыкает круг: минимизация функционала / на пространстве Ж\ эквивалентна решению уравнения Lu = f, и функцию и можно вычислить одним из ука- указанных способов. Процесс расширения Ж% до Ж\ допускает простую геомет- геометрическую интерпретацию. Квадратичный функционал / пред- представляется выпуклой поверхностью — параболоидом в беско- бесконечномерном случае. Сначала, когда функционал / был опре- определен только для функций v из Ж\, на этой поверхности были «дыры». Мы их заполняли. Поверхность менялась так, чтобы ни в коем случае не изменилась минимальность значения, и в результате были устранены мелкие дефекты, соответствующие функциям v, Лежащим в ЖЕ, но не в Ж%. В завершение этого раздела отметим две вырожденные за- задачи, весьма важные в приложениях. Заслуживает внимания то, что в обоих случаях вариационная форма, которую мы только что исследовали, остается прежней;./(у) следует мини- минимизировать на допустимом пространстве ЖХЕ и минимизирую- минимизирующая функция и дает нужное решение. Напротив, операторная форма Lu — f становится сложнее, в особую точку х0 входят специальные условия и решение не лежит более в Ж\. С точки зрения прикладной математики специальное пове- поведение вблизи особенности не следует игнорировать; возможно, это и правильно. Однако с точки зрения аппроксимации конеч- конечными элементами важно, что алгоритм можно осуществить, не зная всей информации об особенности. Такая информация весь- весьма полезна для ускорения сходимости аппроксимаций, как в гл. 8, но алгоритм действует и без нее. Замечание 1. В точке х0, где упругие свойства струны (или коэффициент диффузии среды в тепловом потоке) изме- изменяется скачкообразно, коэффициент р(х) может быть разрывен. В такой точке появляется внутренняя граница. Решение и уже не имеет вторую производную. Чтобы найти «условие скачка» в точке хо, обратимся к вариационной форме задачи; первая вариация \ pu'v' + quv — fv должна равняться нулю для всех у, если и — точка минимума. Полагая, что, кроме Хо, нет дру-



1.3. ВАРИАЦИОННАЯ ПОСТАНОВКА ЗАДАЧИ 2б гих особенностей, интегрируем по частям отдельно в интерва- интервалах (O,#o) и (*о,я): О = \\[- (ри'У + qu - f ] v + p_u'_v_ + о л + \ [— (pu'Y + qu — f]v + p(n) и' (я) v (я) — p+u'+v+. х, Нижние индексы — и '-? обозначают пределы при х-*х0 слева и справа соответственно. Напомним, что у_ = v+ для всех v из Же, так как функция v непрерывна; в частности «_ = «+. Из- Изменяя v, получаем, что дифференциальное уравнение справед- справедливо в каждом интервале, и'(я) = 0 и />_«'_ = />+"+• Это естественное краевое условие в точке - лсо, вытекающее не- непосредственно из вариационной формы: хотя и' имеет скачок, комбинация ри', остается непрерывной. Так как и' имеет скачок, решение лежит в Ж\, но не в Ж\. Это тот случай, когда одна из дыр на поверхности I(v) распо- расположена на самом дне. Минимальное значение I(v) могло бы быть тем же самым на исходном пространстве Ж%, но внутри этого пространства нет функции, реализующей минимум. По- Поверхность находится сколь угодно близко от дыры, но ее можно заполнить только функцией, удовлетворяющей условию скачка. Стандартные оценки ошибок для конечных элементов, спра- справедливые в предположении гладкости и, не пригодны в точке разрыва хо. Их, однако, можно сохранить, если в узле х0 проб- пробные функции в аппроксимации будут удовлетворять условию скачка. Хотя это условие скорее естественное, чем главное, не каждая пробная функция должна ему удовлетворять. Так как не требуется непрерывность производных пробных функций и потому нарушается условие скачка, аппроксимация будет хорошей. Замечание 2. До сих пор требовалось, чтобы неоднород- неоднородный член f принадлежал классу Ж°, так что б-функции исклю- исключались. Физически было бы очень интересно рассмотреть случай, когда б-функция допускается и интерпретируется как точечная нагрузка или точечный источник; математически соот- соответствующая функция и есть фундаментальное решение. По- Поэтому мы попробуем исследовать этот случай с помощью

26 t, введение 6 Теорию функционала минимизируемого на Ж\. Предположим, например, что р ев 1 и у га 0. Если. / обла- обладает конечной энергией, то интеграл / конечен и минимизи- минимизируется просто. Но и для f = б(л;о), 0 < лг0 <С 1, интеграл / коне- конечен. Он имеет вид я I{v)=\{v'fdx-2v{xu), о и минимум реализуется на «ломаной» v = и, изображенной на рис. 1.3. Снова решение не принадлежит Ж\, и дыра соответ- соответствующая этой функции, находится на «дне» бесконечномерного параболоида/(и). U(X) / и(х)- у X' 1 ¦ X -УГ Рис. 1.3. Фундаментальное решение для точечной нагрузки, / н и не принадлежат 96° н Эё2 соответственно. Еще одна возможность: предположим, что точечная на- нагрузка приложена на конце Хо = я, т. е. / = б(я). Тогда реше- решением будет и(х) = х и у функции на рис. 1.3 нет излома. Ре- Решение нарушает естественное краевое условие и'(я) = 0. Воз- Возвращаясь к A1), видим, что это вполне возможно; при р=1, ц =в 0 и и(х) = х первая вариация функционала равна я («V - fv)dx = J (о' — 6(я) v)

1.1. ВАРИАЦИОННАЯ ПОСТАИО»КА 1АДАЧИ 87 для любой функции v из Ж\. Таким образом, первая вариация становится равной нулю при и(х) = х, а значит, это минимизи- минимизирующая функция. Единственное отличие состоит в том, что инте- интегрирование по частям в A1), а значит, и последующий вывод естественного краевого условия «'(я) = 0 не проходят. Следо- Следовательно, если позволить функции / быть сингулярной в точке х = я, естественное краевое условие в этой точке не обязано выполняться. Так как б-функция представляет собой возможный выбор /, сразу возникает общий вопрос: какой класс неоднородных чле- членов / мы можем себе позволить? Точнее, какое пространство данных соответствует пространству решений ЖЕ1 Грубо говоря, пока функционал I(v) остается конечным для всех v из Же, минимизация возможна. Это правило дает возможность выби- выбирать в качестве f б-функции и их линейные комбинации, но не их производные. Например, дипольная функция f = bf(xo) при- привела бы к интеграл в левой части может не быть конечным, так как v' может иметь неограниченный пик в точке хо, хотя и обладает конечной энергией. Дипольная функция «слишком» сингулярна. Итак, мы теперь допускаем, чтобы правая часть принадле- принадлежала пространству Ж~х- функций, производные порядка —1 ко- которых, т. е. их неопределенные интегралы, принадлежат Жй. Оператор второго порядка L переводит пространство Же в Ж~1 так же, как он переводил Ж% в Ж0. Соответствующая норма в Ж~1 определяется формулой ' ll_,= max \\i(x)v (х) dx П Особый интерес представляет случай, когда f есть б-функ- б-функция, сосредоточенная в начале координат, т. е. \/у=0 для каждой функции v из допустимого пространства Же- Это озна- означает, что f в вариационном смысле не отличается от нуля, и ре- решением будет и 5= 0. (Это функция, изображенная на рис. 1.3, при хо — 0.) Отсюда в свою очередь следует, что пространство решений ЖЕ соответствует пространству данных Ж~1 при од- одной оговорке: две данные функции fi и /г считаются одинако- одинаковыми, если они отличаются на б-функцию, сосредоточеннук; в нуле.

28 I. ВВЕДЕНИЕ В ТЕОРИЮ Наконец, решение должно быть непрерывным по f в смысле норм в пространстве решений для и и в пространстве данных для f. Доказательство опирается на равенство нулю первой ва- вариации для каждой функции v из М\, в частности для v,= и: По определению нормы Ц/IL, правая часть ограничена величи- величиной ll/ILillи II,, a левая часть, очевидно, превосходит Рщ^Пи'Ио и; как легко показать, сг||«||^ для некоторого положительного числа а. Поэтому Это и доказывает непрерывную зависимость и от f. 1.4. АППРОКСИМАЦИЯ КОНЕЧНЫМИ РАЗНОСТЯМИ Этот раздел проникнут верой в численный анализ, ибо все, что можно решить абстрактно, можно решить и с помощью конкретных численных расчетов. «Каждому непрерывному ото- отображению соответствует сходящаяся последовательность дис- дискретных аппроксимаций». В предыдущих разделах рассмотрены два непрерывных отображения, переводящих f в и: одно для дифференциального уравнения (|| и ||2 <; С|| f ||0), другое для его вариационного эквивалента (|| и ||j ^ a~l\\ f ||_i). Обе задачи го- готовы для численного решения. Начнем с дифференциального уравнения Lu = f и заменим производные разностными отношениями. Результатом будет ко- конечная линейная система LhUh = fh, дискретная операторная форма. В теоретическом анализе решения разностного уравне- уравнения два основных шага: 1. Вычислить локальную ошибку «отсечения», или дискрети- дискретизации, с помощью разложения в ряд Тейлора. 2. Обосновать общую устойчивость системы, т. е. показать, что Uh непрерывно зависит от fh, если h стремится к нулю. Взятые вместе, эти два шага дают скорость сходимости Uh к точному решению и при /z->0. Наше обсуждение направлено как раз на то, чтобы противопоставить теорию сходимости для разностных уравнений технике, используемой в следующем раз- разделе и во всей оставшейся части книги для доказательства

T.4. АППРОКСИМАЦИЯ КОНЕЧНЫМИ РАЗНОСТЯМИ 29 сходимости в вариационных задачах1). Прекрасно видно, в чем особенность двух описанных шагов, проделанных в вариацион- вариационной форме: вычисление ошибки отсечения здесь заменяется про- проверкой аппроксимационных свойств (или полноты) системы пробных функций, а устойчивость вообще не требует специаль- специального доказательства— для конечных элементов она автомати- автоматически выполняется. Пусть, как обычно, интервал [0, я] разбит на равные части длины h — n/N точками Xi = ih, г = О, 1, ..., N. Производные в уравнении —(ри')'-{-qu = f заменяются центральными раз- разностными отношениями -в результате чего появляется "дискретное уравнение —Ah(pAhU)-{-qu=f, и мы требуем, чтобы оно удовлетворялось во внутренних точках сетки хг: = /(*,)• A3) Так как это уравнение второго порядка, нужно потребовать вы- выполнения краевых условий на концах интервала. Очевидно, что на левом конце Uo=O. На другом конце нельзя найти разно- разностную замену условия м'(я) = 0 однозначно, и мы исследуем две возможности: одностороннюю разность h = 0 A4а) И центральную разность 'JV-I rv В первом случае разностное уравнение A3) удовлетворяется при 0 <Ci <l N, и вместе с двумя краевыми условиями оно дает систему N-\- 1 уравнений с Л^ -f- 1 неизвестными. Во втором слу- случае разностное уравнение рассматривают также и в точке xN — я, чтобы компенсировать лишнее неизвестное UhN+\. Эти краевые условия легко сравнить, когда р = 1 и q = 0: после исключения неизвестных на концах интервала разностные урав- ') В этом разделе мы отступаем от нашей главной темы, но метод ко- конечных элементов и метод конечных разностей так тесно связаны, что их не- необходимо сравнить. Читатель понимает, что именно предпочитаем мы, и, если РН разделяет наше Мнение, может пропустить этот раздел.

SO h ВВЕДЕНИЕ В ТЕОРИЮ неиия имеют вид соответственно A5а) A5b) Чтобы проанализировать разностные уравнения с перемен- переменными коэффициентами р и q, рассмотрим локальную ошибку отсечения xh(x), возникающую, если вместо Uh подставить точ- точное решение и: - ДА (/?ДАи) +/>« —/=т* Это совершенно формальные вычисления; в них u{Xi±h) и p(Xi±h/2) разлагаются в ряд Тейлора вблизи центральной точки Х{. Так как и удовлетворяет дифференциальному уравне- уравнению, члена нулевого порядка не будет; такое сокращение вы- выражает согласованность разностного и дифференциального урав- уравнений. Останутся члены Тот же процесс можно применить и на границах. Для опе- оператора односторонней разности Снова согласованность с точным условием w/(n) = 0 аннулирует член нулевого порядка. Центральная разность, разумеется, точ- точнее: «^тг _L h\ — // (чт — A^ А2 \Jii ^^ ft) IA \Л Ml Ч /// / \ I /"\ / Ь\А\ 2it\ и Когда разностное уравнение и краевые условия рассматри- рассматриваются вместе, а не отдельно, ошибки отсечения выглядят по- другОму. Возьмем, например, матрицы Lh, описанные выше:

1.4. АППРОКСИМАЦИЯ КОНЕЧНЫМИ РАЗНОСТЯМИ 31 Краевые условия использовались здесь для исключения послед- последнего неизвестного. Разложение последней строки в ряд Тейлора для односторонней и центральной разностей дают соответ- соответственно (п — h) — и (я—2А) с, ,ч 1 /•// \ | /->/«. \ * —5-* '- — f (я — h) = — -j и" (я) + О {И) —5 и 2» (я)-2» (я-/») _ f (я) = _ А. „)„ (я В такой форме возникающие полные ошибки составляют 0A) и 0(h), а это не так. Для оценки ошибки Eh = Uh — и исследуем разностное урав- уравнение, которому эта ошибка удовлетворяет: При центральной разности в точке х = я краевые условия для ошибки имеют вид pft ph h2 ch n ?ЛГ+1 nN-l n tl,n i -\ . r\ fu*\ ?0 = 0, 2Л = "F (") + О l« > Отметим, что это разностное уравнение аналогично исходному дифференциальному уравнению, только теперь правыми частями являются локальные ошибки отсечения. Поэтому мы считаем, что главный член в Eh, скажем /z2e2, возникает из членов по- порядка h2 в локальной ошибке: ^ - ~г К*»О"' О еНя) «" Решение е2(л:) этой задачи есть главная функция ошибки. Что- Чтобы найти следующий член в ошибке, подставим и + h2ez в разностную задачу. Это приводит к ошибке отсечения, начинаю- начинающейся с членов порядка /г4, и коэффициент при этом члене есть правая часть в уравнении для е4. Короче, можно рекурсивно определить разложение Uh = u + ti% + h*e4+ ... =2>4W- A6) Вычисление члена еп осуществляется точно так же; разложение Uh прекращается лишь тогда, когда нарушается гладкость ре- решения или когда продолжить разложение не позволяют краевые условия. Одно из положительных качеств разложения A6) — изменение ошибки с изменением х; обычно же у нас только

32 1', ВВЕДЕНИЕ В ТЕОРИЮ далекий от истины максимум ошибки на всем интервале. Далее, разложение A6) позволяет обосновать экстраполяцию Ричард- Ричардсона при h близких к 0; можно вычислить решения с двумя (или более) различными значениями h и выбрать их комбина- комбинацию так, чтобы уничтожить главные члены в разложении. Для задачи с центральной разностью на крае в нашем примере ли- линейный член hei отсутствует, и комбинация Uh и U2h, повышаю- повышающая точность со второго порядка до четвертого, выглядит так: Такая экстраполяционная техника обсуждалась много раз и проверялась численно, однако на практике еще не получила должного применения. Точность краевых условий составляет здесь наиболее серьезное препятствие, в частности в многомер- многомерных задачах, когда граница области пересекает сетку самым причудливым образом. Применяя те же идеи для односторонней разности на крае, видим, что первый член разложения he\ возникает из ошибки 0{h) на границе: [email protected])«0, e[(n)^-^u'f(n). Естественно, центральная разность предпочтительнее. Аппроксимация первого порядка получается также, если дифференциальное уравнение связано с вариационной задачей. Как всегда, положительно определенная симметричная система Lhuh = fh представляет собой уравнение Эйлера, дающее равен- равенство нулю первой вариации функционала U{Vh)~*{LhVh, Vk\~-2(f\ Vh) на минимизирующей функции Uh. С односторонней разностью на крае этот функционал имеет вид N~l Г / 1/А т/л \2 Очевидно, что /д есть конечно-разностный аналог истинного квадратичного функционала

1.4. АППРОКСИМАЦИЯ КОНЕЧНЫМИ РАЗНОСТЯМИ 33 и, что почти очевидно, его точность только первого порядка. Вместо того, чтобы воспользоваться формулой трапеций (вто- (второй порядок точности), "интеграл / заменили суммой односто- . ронних разностей. Описанная техника занимает промежуточное положение между техникой конечных разностей и методом конечных эле- элементов — интеграл / аппроксимируется суммой /д, включающей разностные отношения, а затем минимизируется. Этот простой путь получения аппроксимаций небольшого порядка точности заслуживает больше внимания, чем ему уделяется. Но он теряет свои преимущества, если требуется высокая точность. До сих пор анализ разностных уравнений был достаточно формальным и мы получили разложение ошибки ? hnen. Теперь сделаем второй шаг: докажем, что Uh сходится кии разложение асимптотически справедливо. (Само разложение не может схо- сходиться для конечного значения h, так как для сходимости надо, чтобы функция Uh от h была аналитической и чтобы задача была корректно поставлена даже для комплексных /г; мы на- м деемся доказать, что Uh — X hnen = О (hM+l) при h -у 0.) Второй о шаг требует оценки того же вида, что и для дифференциального уравнения: решение Uh должно непрерывно зависеть от правой части fh. Вернемся теперь к разностному уравнению и выясним пре- прежде всего, существует ли единственное решение Uh для каждой функции fh. Другими словами: является ли матрица Lh невы- невырожденной? Один из наиболее эффективных способов доказа- доказательства обратимости Lh приводит к дискретному принципу мак- максимума. Пусть LhUh — 0. Предположим, что наибольшая компонента |f/?| имеет номер п, и выберем знак Uh так, чтобы ?/?>0. За- Запишем разностное уравнение в точке хп: Так как все члены неотрицательны, они должны равняться нулю. Если коэффициент qn положителен, то сразу же получаем ?/? = 0. В любом случае Un+i = Un = Un-\- Таким образом, Un-i и t/*+i также максимальны, и те же рассуждения можно повторить для п — 1 или для п + 1. Отсюда Un = Uo = 0. Итак, LhUh = 0 только при Uh = 0, и матрица Lh обратима. Аналогично можно показать, что при неоднородных краевых условиях все компоненты Uf не превосходят Uo и Ц%. Это и есть дискретный принцип максимума, из которого следует, что дискретная функция Грина (Lh)-1 — неотрицательная матрица. 2 Зак. 287

34 I. ВВЕДЕНИЕ В ТЕОРИЮ Подобное доказательство приводит к теореме Гершгорина в теории матриц: все собственные значения К матрицы А лежат в объединении кругов Выбирая в качестве А матрицу h2Lh из формулы A5), видим, что собственные значения удовлетворяют неравенству |Я — 2|^ ^ 2. Таким образом, теорема Гершгорина не исключает возмож- возможности К = 0, т. е. вырожденности матрицы Lh\ здесь нужно повторить рассуждения для i = п—1, п — 2, ..., 1. Теорема Гершгорина становится совершенно бесполезной для задач четвертого порядка. Коэффициенты в простейшем слу- случае равны: Ац = 6, Ait t±i = —4, Aif i±2 = 1, а круги Гершгорина таковы: \К — 6|^ 10. Так как точка К = 0 лежит внутри этих кругов, доказательство не проходит даже для полуопределенной матрицы А. Эта трудность связана с тем, что в случае задач четвертого порядка не действует принцип максимума. Если сравнить два уравнения и" = 0 и m<iv> = 0, то очевидно, что прямая имеет экстремумы на концах интервала, а кубическая кривая нет. Принцип максимума, если он работает, позволяет сделать доказательство сходимости простым. Но мы хотим сохранить полную аналогию между дифференциальным и разностным уравнениями, вводя дискретное неравенство, соответствующее ||ы||2 ^ dl/llo- Прежде всего зададим нормы, которые можно при- применять к сеточным функциям. Для дискретной энергии, оче- очевидно, положим Для квадрата второй нормы сложим энергию функции с энер- энергией ее первых и вторых разностных отношений «вперед»: В этих суммах используются только узловые точки: разностное отношение «вперед» определено как Д+f* = (/j+i — fi) /h и не берется в последней узловой точке. Следует учесть еще одно обстоятельство, а именно неодно- неоднородность краевых условий. Для двухточечной краевой задачи непрерывная зависимость решения и от f и краевых данных выражается неравенством b '(*)|). A7) Для конечно-разностного уравнения, в котором Ая означает краевой оператор, примененный на правом конце интервала, со-

1.4. АППРОКСИМАЦИЯ КОНЕЧНЫМИ РАЗНОСТЯМИ 35 ответствующее неравенство будет l|f/ft|2<C(|fftlo + |f/oA| + |Anf/'l|). A8) При любом выборе разностных уравнений это основная оценка, и ее надо доказать. Она не вытекает автоматически из нера- неравенства A7), которое тем не менее должно быть выполнено: выполнение непрерывного неравенства необходимо, но не до- достаточно для выполнения дискретного неравенства. В этом смы- смысле теория разностных уравнений сложнее; существует множе- множество разностных схем и каждая требует более или менее нового -доказательства неравенства A8)- Как и в непрерывной задаче, мы будем предполагать, что неравенство справедливо, и зай- займемся его применением; техника доказательства таких нера- неравенств в одномерном случае подробно рассмотрена Крайссом [К 7]. Неравенство A8) означает устойчивость разностного урав- уравнения: дискретное решение Uh непрерывно зависит от данной функции fh и равномерно по п. Для обоснования сходимости Uh' к и нам понадобится одна из самых важных теорем численного анализа: аппроксимация ') и устойчивость влекут за собой сходимость. Эта теорема дока- доказывается в два этапа. 1. Ошибка Eh удовлетворяет тому же разностному уравне- уравнению A3), что и Uh, и потому по устойчивости непрерывно зави- зависит от своих данных, представляющих собой не что иное, как локальную ошибку отсечения: ¦ 2. Так как существует аппроксимация, доказываемая с по- помощью разложений Тейлора^ функций %h, Eh{0) и Ая?/г, то пра- правая часть стремится к нулю при /г->0. Сходимость, таким обра- образом, доказана. Остановимся еще на одном вопросе. Так как xh включает четвертую производную от и, оценка ошибки при центральных разностях имеет вид ||?Л||в^ С7г2||и]|4. Это неравенство после не- небольших преобразований сводится к Таким образом, порядок сходимости равен /г2, если и лежит в 5^2, или, другими словами, если / лежит в Жй. Скорость сходи- сходимости здесь та же, что и для простейшего метода конечных элементов в разд. 1.6, но доказательство гораздо проще. ') Когда говорят, что дифференциальное уравнение аппроксимируется разностным, подразумевают, что ошибка отсечения xh стрэмится к нулю при h -*¦ 0. — Прим. перед.

36 1. ВВЕДЕНИЕ В ТЕОРИЮ Подводя итог, отметим, что для одномерных разностных уравнений удовлетворительная теория возможна, но она не три- тривиальна. Для многомерных задач, таких, как уравнения в част- частных производных, доказательство сходимости в литературе по численному анализу почти всегда основано на принципе макси- максимума. Когда этот принцип не работает, для задач специального вида можно использовать некоторые соображения, но общая теория сейчас развивается в таком направлении, что, по-види- по-видимому, ее чрезвычайно трудно применить. Вся трудность в том, что одно дифференциальное уравнение допускает множество различных разностных аппроксимаций, особенно при криволи- криволинейных границах. В противовес этому вариационные методы подчиняются более строгим правилам, и именно эти ограниче- ограничения позволяют сделать теорию более полной. Мы будем заниматься исключительно этой теорией — по- построением и сходимостью конечных элементов. 1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ Приступим, наконец, к изложению собственно метода конеч- конечных элементов. Общие рамки вопроса определены, и, как мы видим, есть выбор: можно либо аппроксимировать отдельные члены дифференциального уравнения, либо использовать прису- присущий задаче вариационный принцип. Метод конечных элементов выбирает последнее. В то же время дискретные уравнения, воз- возникающие при вариационной аппроксимации, являются разност- разностными. В вариационной форме задача заключается в минимизации квадратичного функционала я =\ [р (х) (vr (х)J + q (x) (v (х)J - 2f (x) v (*)] dx на бесконечномерном пространстве Ж\. Метод Ритца состоит в замене ЖХе в вариационной задаче конечномерным подпростран- подпространством S, или, точнее, последовательностью конечномерных под- подпространств Sh, содержащихся в Ж\. Элементы vh из Sh назы- называются пробными функциями. Так как они принадлежат Ж\, они удовлетворяют главному краевому условию ул@) = 0. На каждом подпространстве Sh минимизация функционала / при- приводит к решению системы линейных уравнений; число уравнений совпадает с размерностью подпространства Sh. Аппроксимация Ритца — это функция uh, минимизирующая I на подпростран- подпространстве Sh; I {и'1) < / {vh) для всех vh e= Sh.

1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 37 Основные задачи: 1) определить uh, 2) оценить расстояние между uh и истинным решением и. Этот раздел посвящен задаче 1), а следующий —задаче 2). Начнем с двух примеров, иллюстрирующих классический ме- метод Ритца. Подпространства Sh не будут., иметь специального вида, связанного с методом конечных элементов; вместо этого каждое подпространство в последовательности {Sh} будет со- содержать предыдущее. Пусть сначала коэффициенты р и q постоянны, a Sh — под- подпространство, натянутое на первые N = \jh собственных функ- функций дифференциальной задачи. Пробные функции, т. е. элемен- элементы из S\ будут тогда линейными комбинациями вида N N vh м=Z qivi м=Z qi V тsin (у ~ i 1 qi V т(у I2*х- i 1 Ясно, что эти функции принадлежат Ж\; они удовлетворяют даже естественному краевому условию (yh)'(n)=- 0, что вовсе и не обязательно. Весовые коэффициенты ^/должны быть определены из усло- условия минимума /. Так как собственные функции ортогональны, интеграл имеет вид N где hj~p(j—1hJ + q- Условия минимума dI/dqj = O сразу приводят к оптимальным значениям весов: Поэтому аппроксимацией Ритца будет функция if, ф/)ф/ В этом случае система линейных уравнений dl/dq, = 0, опре- определяющая оптимальные координаты Qj, решается очень просто; матрица системы оказалась диагональной, так как собственные функции ортогональны. Более того, uh представляет собой про- проекцию точного решения E(F, ф/) ф/ ч

38 1. ВВЕДЕНИЕ В ТЕОРИЮ на подпространство, натянутое на первые N собственных функ- функций. Легко подсчитать, какой получается выигрыш на каждом- шаге в последовательности аппроксимаций Ритца. Когда N-я пробная функция <$N включается в рассмотрение, uh улучшается добавлением члена ^a/'(/, Фл/)фм- Эта добавка при N-+oo очень быстро стремится к нулто для гладких функций /, но даже для произвольной функции / она не превышает ^w'll/llo- В реальной задаче собственные функции точно не известны, но если геомет- геометрия области остается простой, все еще огромное значение имеет использование синусов и косинусов в качестве пробных функ- функций. (Орсзаг и другие авторы показали, как с помощью бы- быстрого преобразования Фурье сохранить в разумных пределах объем вычислений.) Для областей* со сложной геометрией мы предпочитаем конечные элементы. Пусть р и q остаются постоянными, а в качестве пробных функций теперь возьмем полиномы Такие функции опять удовлетворяют главному краевому усло- условию у/[email protected]) = 0, но естественное краевое условие нарушается. В этом случае я о Дифференцируя / по параметрам qj, находим систему N линей- линейных уравнений относительно оптимальных параметров Qu .., ..., Qn: F Неизвестный вектор здесь Q = (Qi QN), компоненты век- вектора F являются «моментами» Ft = \ fx1 dxt а элементы мат- матрицы коэффициентов К таковы: я Кц = \ \Р (/*<-') (/V-1) + qx'x'] dx = « + / - 1 • i + I + 1 ' Матрица, элементы которой имеют вид (г + /+ I),' известна как матрица Гильберта; с ней производить вычисления совер- совершенно невозможно. Ее собственные значения настолько несоиз-

1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 39 меримы — она так плохо обусловлена, — что уже при iV«6 ошибки округления «забивают» правую часть f. Если в К вклю- включены другие члены, ситуация еще хуже. Трудность в том, что степени х' почти линейно зависимы; в окрестности точки х = п все они имеют нулевые веса. Численная устойчивость зависит от выбора «более независимого» базиса в подпространстве. Для получения такого базиса надо сначала ортогонализо- вать исходные пробные функции ср^ = xi. В большинстве случаев можно в качестве нового базиса для пространства полиномов взять полиномы Лежандра или Чебышева. Такой базис удобен на интервале и даже на областях большей размерности, если только геометрия области очень проста. Для областей общего вида, однако, эти ортогональные полиномы опять становятся неработоспособными. Вернемся к построению подпространств Sh в методе конеч- конечных элементов. Область — в нашем случае интервал [0, л] — разбивается на отрезки, и на каждом из них в качестве пробных функций vh берутся полиномы. В узлах между отрезками тре- требуется некоторая степень непрерывности, и обычно эта непре- непрерывность не более чем требуют следующие условия: 1.. Функции vh должны быть допустимы для вариационного принципа задачи. 2. Величины, представляющие физический интерес, такие, как перемещения, нагрузки или моменты, должны удобно вычис- вычисляться из приближенного решения uh. Очень трудно построить кусочно полиномиальные функции, если требовать слишком большую гладкость в узловых точках между отрезками. В нашем примере допустимым пространством Ж\ будет про- пространство непрерывных функций. Кусочно постоянные функции сразу отбрасываются. Поэтому проще всего взять в качестве Sh множество функций, линейных на каждом интервале [(/—l)h,jh], непрерывных в узлах х = jh и равных нулю при х = 0. Производная от такой функции кусочно постоянна и об- обладает, очевидно, конечной энергией: таким образом, Sh — под- подпространство пространства Ж\. Такие пробные функции мы будем называть линейными элементами. Пусть функция <$ь принадлежит Sh, равна 1 в узле х = jh и 0 во всех остальных узлах, /= 1, ..., N (рис. 1.4). Такие функции-крышки образуют базис в подпространстве Sft, так как любой элемент из Sh можно записать в виде vh (х) = ? <7/<P/h (x).

40 I. ВВЕДЕНИЕ В ТЕОРИЮ Отметим важный факт, касающийся коэффициента q,: он сов- совпадает со значением v в /-м узле х = jh. Поскольку координаты <7j — это не что иное, как узловые значения функции, оптималь- оптимальные координаты Qj будут иметь непосредственный физический смысл: они будут аппроксимациями Ритца для перемещения струны в узлах. Отметим также, что <р^ образуют локальный базис, так как каждая функция ф^ отлична от нуля только в области диаметра 2А. В самом деле, очевидно, что функции Рис. 1.4. Кусочно линейные базисные функции. Фу1—! и ф^+1 ортогональны, так как там, где одна из них отлична от нуля, равна нулю другая. Таким образом, хотя базис не совсем ортогонален, только соседние элементы в произведении дают не нуль. С нормализованными коэффициентами р = q = 1 задача со- состоит в минимизации функционала (vhJ - 2f vh\ dx. При 0Л = 2<7/Ф^ этот интеграл является квадратичной функцией координат <7Ь q2, ..., qN и его можно вычислять на одном ка- каком-нибудь подынтервале. На /-м подынтервале функция vh ли- линейна, vk ((/ - 1) h) = q,-u vh (jh) = q, и (i/1)' = {q, - qt^)lh (будем считать, что <70 = 0)- Поэтому ((vhOdx-

1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 41 Чуть более длинное вычисление дает /ft (/-Oft Эти члены сответствуют отдельному куску струны с линейным изменением перемещения. Для всей струны член второго по- порядка в l{vh) равен Это не слишком удобная форма записи результата. Предпочти- Предпочтительнее получить результат в матричном виде qrK.q (или {K,q,q)), так как матрица К нам еще понадобится. Причина в том, что выражение для I(uh) квадратично относительно пара- параметров q = (<7ь <7г. • •.. <7^) и имеет вид Минимум такого • выражения достигается (как мы знаем из разд. 1.3, где мы положили dl/dqm = 0) на векторе Q = (Qi, ... .••, Qn), определяемом системой Именно эту систему и нужно решить, поэтому все, что нам нужно знать, — это матрицу К и вектор F. Наилучший способ — найти вклад в матрицу К каждого «элемента», т. е. каждого куска струны. Для этого вернемся к формуле и запишем правую часть (величину интеграла) в матричной форме Матрица k\ называется матрицей жесткости элемента. Ее доста- достаточно вычислить один раз, так как она не зависит от дифферен- дифференциального уравнения. Точно так же вычисление члена \(vhJdx

42 1. ВВЕДЕНИЕ В ТЕОРИЮ нулевого порядка на отдельном элементе проводится один раз и в результате получается матрица массы элемента: Далее суммирование по всем элементам /==1, ..., N заме- заменяется построением глобальной матрицы жесткости К. Это означает, что после соответствующего расположения в позициях глобального массива матрицы элементов складываются. Мат- я рица, связанная с \ ((vh)'Jdx, при условии, что неизвестное q0 о отброшено (так как оно определяется главным краевым усло- условием), имеет вид 2 — 1 0 0 - 1 2 -1 О 1 - 1 О — 1 — 1 о -1 1 о J 2 -1 О О — 1 1 Снова матрица и интеграл связаны формулой Интеграл от (vhJ равен qTKuQ, где матрица массы Ко (в даль- дальнейшем обозначаемая через М) строится точно так же: 4 1 0 0 1 4 1 . 0 0 1 , 1 0 0 , 1 4 1 . 0 0 1 2

1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 43 Требуемая матрица К будет суммой К\ + /Со- Эти матрицы не нужно все сразу строить и хранить; вместо них можно вычис- вычислить матрицы элементов, когда они понадобятся при решении итоговой системы KQ = F. Осталось вычислить член \ fvh, с которым неоднородная на- нагрузка / входит в аппроксимацию. Этот интеграл линеен отно- относительно координат qf. 10 здесь вектор нагрузок F имеет координаты На практике эти величины вычисляются так же, как матрицы жесткости и массы, интегрированием сразу только на одном элементе. Пусть на /-м интервале (/ —1) А Когда такие интегралы суммируются, коэффициент при qu равен /?ft = Pft + aft+i. Отсюда ясно, какова простейшая форма хране- хранения в памяти ЭВМ. Заданный узел kh является правым концом в k-м подынтервале — и это дает fiuqk в интеграле, а также ле- левым концом в следующем подынтервале — и это дает au+iQh- Подпрограмма, строящая вектор, должна учитывать, что оба подынтервала стыкуются в k-м узле, и комбинировать резуль- результаты. (Нет сомнений, что такое построение метода конечных эле- элементов сделает программу длиннее программы метода конечных разностей для двухточечной краевой задачи; преимущества ме- метода конечных элементов опять проявляются только на зада- задачах размерности > 1.) Для произвольной функции / интегралы нельзя подсчитать точно, и нужно использовать численные квадратурные формулы. Одна возможность состоит в аппроксимации f линейной интер- интерполяцией по узлам. Другими словами, / заменяется кусочно ли- линейным интерполянтом ff = 2 /йф? (х), где fk — значение / в узле х = kh. Тогда при вычислении интеграла \ ftvh возникают те же

44 1. ВВЕДЕНИЕ В ТЕОРИЮ самые скалярные произведения \ <р?<р^, что и ранее при построе- построении матрицы массы k0. На /-м интервале \ !) так как единственное различие между вычислением этого ин- интеграла и \(vhJdx заключается в замене пары коэффициентов <7з и <7j_i узловыми значениями /. Снова, суммируя на ЭВМ эти результаты от / = 1 до / = N, получаем матрицу массы Я\ Яы Ко отличается от /Со только наличием нулевой строки, так как, вообще говоря, /@) ф 0. Этот интеграл приближает точный линейный член FTq, кото- который можно было бы получить, выполняя точное интегрирование. Обозначим приближение через PTq. Матрица массы Ко дает ко- коэффициенты в аппроксимации вектора нагрузок F: Разность между У?) и точным значением F, = \ /ф^ нетрудно оценить. Если функция f линейна, коэффициенты F/ и F/ совпа- совпадают, поскольку // совпадает с /. Для квадратичной функции / это не так. Если f (х) = х2, то /ft </+i)ft F,= \ x*(~j+l + ±)dx+ \ (/-i)ft /ft в то время как F, = ^ [(/ - IJ + 4/2 + (/ + IJ] = /^ + -^. Поэтому ошибка численного интегрирования равна Л3/6 = = /z3/"(/7i)/12. Для произвольной гладкой функции f — это главный член в Fj — Fj.

1.5. МЕТОД, РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 45 Существует формула интегрирования, столъ же простая, как и формула для Fj, точная на квадратичных (и даже кубических) членах: =Г *(//-! + "У/ F,= j Она выведена Коллатцем (см. [Г2]). Ее можно получить с помощью квадратичной интерполяции / на двойном интервале [(/—1)А, (/+1)А] и последующего точного интегрирования F. = \//ф?йх Однако для программ метода конечных элемен- элементов этот вывод неестествен. Вместо того, чтобы один раз вычис- вычислить интеграл на [jh, (/+ l)h], надо пройти по каждому интер- интервалу дважды: сначала использовать квадратичную интерполя- интерполяцию по узлам Xj-i, Xj, Xj+\_ и вычислить Fj, а затем — по узлам X], xi+\, Xj+2 и вычислить Fj+\. Это типичная ситуация: наиболее эффективная формула в определенном классе не обнаружи- обнаруживается при применении метода конечных элементов; если в каж- каждом специальном случае предоставить полную свободу выбора наилучшей формулы, то могут оказаться предпочтительнее ко- конечные разности. Важно, что при решении сложных задач фор- формула метода конечных элементов «почти» оптимальна и просто и дешево реализуется на ЭВМ. На практике вместо замены функции / ее интерполянтом fi часто проводится прямое численное интегрирование. На каждом подынтервале fvh интегрируется по стандартной квадратурной формуле Чаще всего выбирается весьма эффективная квадратура Гаусса, например с равными весами wt и двумя симметрично располо- расположенными узлами |j = (/+l/2± l/V^ )Л- Эта формула точна для кубических функций / и обеспечивает автоматически ту же точность, что и формула Коллатца, описанная выше. Одноточеч- Одноточечная формула Гаусса с точкой |,-, взятой в середине каждого ин- интервала, уже обеспечивает точность, присущую линейным проб- пробным функциям: р = h (f/-'A + f/+¦/,) _ (Формула трапеций с равноотстоящими узлами дает в точности правую часть Fj = /i/(//i) обычного трехточечного разностного уравнения, полученного в разд. 1.4.) В результате любого численного интегрирования точные ли- линейные члены FTq заменяются некоторым приближенным выра-

46 1. ВВЕДЕНИЕ В ТЕОРИЮ жением FTq, все еще линейным относительно неизвестных q\, ... .... qN- Те же идеи применяются к квадратичным членам, если коэф- коэффициенты р(х) и q(x) в дифференциальном уравнении действи- действительно зависят от х. Интегралы от р(х) ((vh)'J и q(x)(vhJ опять вычисляются на каждом подынтервале с помощью числен-' ной квадратуры. Итоговые результаты хранятся в виде прибли- приближенных матриц, квадратичные формы которых близки к точным интегралам qTK\q и qTKoQ- Мы будем предполагать, что все интегралы вычислены точно, а в разд. 4.3 изучим влияние оши- ошибок, возникающих при численном интегрировании.. Теперь попытаемся суммировать наши идеи. Обозначая через Л* сумму /Ci -f /Co и производя описанные вычисления, получаем / (о*) = / (? q.tf) = qTKq - 2F*q. Это дискретное выражение, подлежащее минимизации в методе Ритца. Сразу видно, что это стандартная вариационная форма; минимизирующий вектор Q определяется линейным уравнением Назовем его уравнением метода конечных элементов. Решение этого уравнения — центральная часть всех вычислений, и если число h мало, порядок системы будет большим. Матрица К с гарантией положительно определена и поэтому обратима; так как р > 0, то величина q*Kq= $ Р (X) (? <7,Ф;J + q (х) может равняться нулю только при 2J <7/ф/ = 0> а это возможно только тогда, когда q, = 0 при всех /. Глобальная матрица жесткости К похожа на матрицу ме- метода конечных разностей Lh, вернее на Л/Лиз предыдущего раз- раздела. При постоянных коэффициентах главные .члены у них совпадают, обе пропорциональны вторым разностям с весами — 1, 2, —V. Член нулевого порядка qu входит только в диаго- диагональные элементы матрицы Lh. А вот в матрице К этот член проявляется в связях между соседними неизвестными и «сгла- «сглажен» с весами 1, 4, 1, возникающими из формулы Симпсона. Подчеркнем еще раз, что как только выбрано аппроксимирую- аппроксимирующее подпространство Sh, дискретная форма каждого члена уравнения полностью определена. Метод Ритца действует сразу на все уравнение и не требует от пользователя принятия неза-

1.5, МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 47 висимых решений при аппроксимации различных членов урав- уравнения. В частности, упрощается работа с краевыми условиями, и, учитывая различные возможности, возникающие в разност- разностных уравнениях, можно только удивляться тому, что порядок точности некоторых краевых условий выбирается «автомати- «автоматически» с помощью уравнения метода конечных элементов. Ис- Используя последнюю строку матрицы К, запишем уравнение в граничной точке х = я в случае р = q = 1: я—ft Подставляя точное значение «(х,). вместо <7j и разлагая и и f в ряд Тейлора в точке х = п, находим ошибку отсечения (Мы воспользовались дифференциальным уравнением —«"+1 '-\-u = f и краевым условием ы'(я) = 0.) В терминах разност- разностных уравнений это означает, что краевое условие имеет третий порядок точности. Последний шаг при вычислении аппроксимации uh метода конечных элементов — решение линейной системы KQ = F. Мы собираемся обсудить здесь только прямые методы исключения, так как в подавляющем большинстве программ по методу ко- конечных элементов они предпочтительнее итерационных методов. (Было бы интересно обсудить возникновение и упадок итера- итерационных методов за последние десятилетия. Очень много сложных и математически интересных работ было посвящено методам верхней релаксации и переменных направлений; они составляли основную тему численного анализа. Теперь они вы- вытеснены методом исключений и методами типа быстрого пре- преобразования Фурье. Методы типа метода Фурье, безусловно, эффективнее, если геометрия области, и уравнения подходящие, а методы исключения особенно хороши, когда нужно решать одну систему с многими правыми частями, как в задачах проек- проектирования.) Обсудим кратко теорию исключения Гаусса. При примене- применении этого знакомого алгоритма к матрице К общего вида сна-, чала исключается Q{ из последних N—1 уравнений, затем Q2 из последних Af — 2 уравнений и т. д.; наконец, исключается QW-i из последнего уравнения. Система KQ = F преобразуется

48 1. ВВЕДЕНИЕ В ТЕОРИЮ в эквивалентную систему UQ = и. 22 и NN Q, Qn После этого неизвестные Q3- определяются с помощью обрат- обратной подстановки: последнее уравнение решается относительно Qiv, после подстановки значения QN решается предпоследнее уравнение относительно Qw-i и т. д. Важно понять, что происходит, в терминах матриц. Предпо- Предположим, что мы ведем процесс, обратный исключению, прибав- прибавляя к последнему уравнению (N—1)-е с множителем tNiN-i — в прямом процессе исключения QN-\ оно вычиталось. Далее прибавим к последним двум уравнениям (N — 2)-е с множите- множителями /jv_i, jv_2, In,n-2 — при исключении Qjv-2 оно вычиталось. В конце концов восстанавливается исходная система KQ = F; к t-му уравнению прибавляется предыдущее, умноженное на-/г-3-, / = 1, ..., i— 1, — они вычитались при исключении неизвестных 'Qi, ..., Qi-i. В терминах матриц система KQ = F восстанав- восстанавливается умножением преобразованной системы UQ = F' на матрицу A ¦> Л lit — 1. Л/—9 1 LN-\, N-2 'n, n-z I N, N-l Это означает, что LUQ = LF' равносильно KQ = F. Исключе- Исключение Гаусса есть не что иное, как разложение К в произведение нижней треугольной и верхней треугольной матриц. Таким об- образом, решение K~lF, которое мы ищем, есть не- что иное, как U-XL~XF, и треугольные матрицы L и U легко обращаются. Действительно, L~XF = F' — правая часть системы после исклю- исключений и Q = U~XF' — результат обратной подстановки. (Если нужно решить много систем KQ = Fn с различными правыми частями, но с одной и той же матрицей жесткости К, сомножи- сомножители L и U следует хранить.)

1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 49 Рассмотрим процесс исключения, когда известно, как в на- нашем случае, что матрица К симметрична, положительно опре- определена и трехдиагональна. Прежде всего заметим, что процесс достигает цели: исключения можно осуществить и разложение К = LU существует. Процесс нельзя провести, например, в слу- случае /О 1\ матрицы К = \ I, поскольку Q\ нельзя исключить из второго уравнения, используя первое. Условие возможности про- провести процесс исключения таково: каждая матрица в левом верхнем углу матрицы К, т. е. —(Аи), А L, v VA21 А22 должна иметь ненулевой определитель. Для положительно определенной матрицы все эти определители положительны, и потому процесс осуществим без перестановки строк. Действи- Действительно, определитель матрицы К^ равен произведению t/11f/22'..¦ Uа и все элементы U}j, лежащие на главной диаго- диагонали матрицы U, положительны. Для численной устойчивости алгоритма исключения тре- требуется еще, чтобы элемент Ujj был не только ненулевым, но и достаточно большим. Если алгоритм неустойчив, то можно по- потерять всю информацию об исходных коэффициентах Кц. Мы осуществляем только частичный контроль за размером элемен- элементов Utj, так что неизбежны некоторые ошибки округления. Внутренняя чувствительность матрицы К к малым возмуще- возмущениям определяется ее числом обусловленности, примерно рав- равным отношению наибольшего собственного значения к наимень- наименьшему. Этот вопрос обсуждается в гл. 5. Число обусловленности зависит от размера шага h и от порядка дифференциального уравнения. Вычислительные трудности иногда возникают не из-за плохой обусловленности матрицы К, а из-за неудачно выбранного алгоритма. В матрице типа К = [ < I, например, следует сначала поменять уравнения, или что то же самое, вы- выбрать главный элемент. Если каждый раз менять строки так, чтобы элемент Цц был максимальным, алгоритм исключения Гаусса станет настолько устойчивым, насколько позволяет число обусловленности. «Неприятная» матрица К в нашем при- примере, разумеется, не является положительно определенной; такая ситуация типична для матриц, возникающих в методе «смешан- «смешанного типа» (разд. 2.3). Прямой метод для матриц жесткости (в котором неизвест- неизвестные представляют собой перемещения и, как в большей части

60 1. ВВЕДЕНИЕ В ТЕОРИЮ этой книги) автоматически приводит к положительно опреде- определенной матрице К. В этом случае исключение Гаусса не только возможно без перестановки строк, но и численно устойчиво. Чтобы понять почему, приведем разложение Л' == LU к более симметричной форме, выделяя диагональ матрицы U: •I Unn Ясно, что К = LD(D~XU), причем все три сомножителя опре- определены однозначно: L — нижняя треугольная матрица с еди- единичной диагональю, D~XU— верхняя треугольная матрица с единичной диагональю и D — диагональная матрица с поло- положительными элементами. По симметрии матрица D~XU должна быть транспонированной к L. Итак, K = LDLT — получили симметричную форму разложения. Можно даже пойти дальше и ввести новую нижнюю треугольную матрицу L = LDXI2\ это даст р-азложение Холесского К = LtT. Теперь можно объяс- объяснить, почему положительно определенная симметричная мат- матрица не требует выбора главного элемента: множитель L в раз- разложении ведет себя как корень квадратный из К и число об- обусловленности в точности равно числу обусловленности этого корня. Это можно сравнить с разложением /е 14 /1 04/е 0-4/1 е-4 \\ 0J Ь-1 IА 0-е-1 До 1 )' множители в правой части которого велики, даже когда мат- матрица в левой части не зелика. Наконец, трехдиагональность матрицы К приводит к серь- серьезному уменьшению объема вычислений. Так как первое неиз- неизвестное Q] исключается лишь из второго уравнения (в других его нет), все множители /з, ь ..., /jv-i, ь необходимые для ис- исключения Qi, равны нулю. Неизвестное Q2 исключается лишь из третьего уравнения и т. д. Таким образом, ненулевые эле- элементы нижней треугольной матрицы L расположены лишь на главной диагонали и на первой поддиагонали; трехдиагональ- ная матрица разлагается на двухдиагональные. Так как разложение Холесского требует извлечения квад- квадратных корней из главных элементов и приводит к некоторым дополнительным проблемам, связанным с необходимостью из- избежать операций с нулями, наиболее популярный численный

1.5. МЕТОД РИТЦА И ЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 61 алгоритм основан на разложении К = LDLT. Разложение Хо- лесского и такое разложение эквивалентны как математически, так и с точки зрения устойчивости. Для трехдиагональной мат- матрицы элементы матриц L и D удовлетворяют простой рекур- рекуррентной формуле к, Соответственно вектор F' = L~XF и решение Q, вычисляемое из обратной подстановки, равны Важно, что число арифметических операций здесь пропорцио- пропорционально N. В многомерных задачах матрица жесткости К также будет разреженной и симметричной положительно определенной. Од- Однако здесь уже нет такого очевидного упорядочения неизвест- неизвестных, как в одномерном случае. Способ упорядочения узлов приобретает основное значение, и разрабатываются подпро- подпрограммы упорядочения, приводящего к минимальным затратам при исключении Гаусса. Наиболее простым и популярным критерием выбора по- порядка узлов является ширина ленты матрицы. Пусть известно, что только первые w поддиагоналей и первые w наддиагоналей в матрице К ненулевые (для трехдиагональных матриц по этому определению ш = 1). На каждом шаге процесса исклю- исключения эта информация должна использоваться наилучшим об- образом. Ниже каждого главного элемента может быть только w ненулевых элементов, подлежащих исключению; более того, каждое исключение — это вычитание из одной строки другой с некоторым множителем, а мы знаем, что в строке не более 2ау + 1 ненулевых элементов. Ленточная структура в процессе исключения сохраняется и переносится в сомножители L и U. Для симметричной матрицы число операций равно примерно Nw2/2 вместо Л^3/3 для плотной матрицы. В качестве простейшей иллюстрации хорошего и плохого упорядочения узлов, с точки зрения ширины ленты, рассмотрим двумерный случай при прямоугольном расположении узлов. Если по горизонтали узлов меньше, чем по вертикали, то неиз- неизвестные нумеруем последовательно вдоль строк, а не столбцов.

52 1. ВВЕДЕНИЕ В ТЕОРИЮ Ширина ленты равна примерно длине строки, так как для дан- данного узла связь с узлом, лежащим выше него (с которым дан- данный узел связан ненулевым элементом в матрице жесткости), при таком упорядочении проявится быстрее. В общем случае матрицы в методе конечных элементов куда менее система- систематичны, чем в случае разностных уравнений, и выбор оптималь- оптимального упорядочения совсем не очевиден. Существует другой критерий, учитывающий разреженность матриц; он чуть точнее, чем ширина ленты. Он основан на про- профиле (очертании) матрицы. Возьмем первый ненулевой элемент в i-й строке. Если он оказался в /-м столбце и об этом «изве- «известно» ЭВМ, то не обязательно вычитать строки с номерами 1, 2, ..., /—1 из i-й строки. Соответствующие множители liiU U,2, .... U,i-i будут равны нулю, так как неизвестные Qb Q2, ... .... Qj_! не надо исключать из i-ro уравнения: их уже нет. Про- Профиль матрицы формируется при определении этих первых не- ненулевых элементов в каждой строке, и, подобно ленточной структуре, профиль сохраняется-в процессе исключения Гаусса и переходит без изменения в множитель L. Профиль как бы вклинивается в ленту, так что длина многих строк гораздо меньше 2ш + 1, и очень полезно хранить профиль в ЭВМ и даже упорядочивать неизвестные в соответствии с алгоритмом, ориен- ориентированным на профиль. Отметим, что число арифметических операций — не един- единственный критерий выбора алгоритма; по крайней мере столь же важной может оказаться потребность в оперативной памяти. Для ленточной матрицы стандартная процедура требует хране- хранения диагоналей матрицы; эта ситуация близка к оптимальной, и для нее надо порядка Nw ячеек. Для линейных или билиней- билинейных элементов на прямоугольной сетке 50 X 50 число N равно 2500 и ш « 50. Современная большая ЭВМ позволяет хранить информацию за пределами оперативной памяти, но программи- программирование и обмен данными становятся гораздо сложнее. По- Поэтому большее внимание следует уделять алгоритмам, учиты- учитывающим и использующим, где возможно, разреженность мат- матрицы даже внутри ленты или профиля. В крайнем случае можно даже запоминать положение каждого ненулевого эле- элемента матрицы А и порядок неизвестных, как в «алгоритме для разреженной матрицы», чтобы минимизировать число ненуле- ненулевых элементов в нижней треугольной матрице L. Нам кажется, правда, что для матриц метода конечных элементов это слиш- слишком дорого; в нем иногда трудно учесть систематическую струк- структуру матриц. Если задача так велика, что стандартный алгоритм, основан- основанный на ленте матрицы или ее профиле, не помещается в опе- оперативную память, мы предпочитаем следовать циклу статей

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 53 Алана Джорджа. Он задался такой целью: для конечных эле- элементов с N неизвестными параметрами на плоскости добиться O(N3/2) арифметических операций при хранении 0(N\ogN) не- ненулевых элементов матрицы L. Это было бы действительно хорошо. (Существует несколько специальных прямых методов, аналогичных быстрому преобразованию Фурье, требующих только О (TV log TV) арифметических операций при общем объеме памяти O(N). Однако применение этих методов ограничивается простыми задачами на прямоугольниках.) Такие цифры дости- достигаются при упорядочении [Д7], напоминающем алгоритм мини- минимальных степеней: на каждом шаге неизвестное, которое ис- исключается, должно быть связано только с несколькими неизве- неизвестными. Метод значительно отличается от прямого метода Ай- ронса и связан с большими затратами при составлении про- программы, возможно, даже слишком большими. Последние пред- предложения по этому методу даны в статье Джорджа «An efficient band-oriented scheme for solving n by n grid problems». Он раз- разбивает область на узкие полосы и применяет ленточный алго- алгоритм для соответствующих подматриц (неизвестные внутри по- полосы занумерованы так, чтобы уменьшить ширину ленты). Между двумя полосами остаются неизвестные, расположенные на прямой, и в упорядочении Джорджа они нумеруются только после неизвестных в полосах, выделенных прямыми. На этих прямых сравнительно мало неизвестных, которые вносят вклад в расширение ленты матрицы. Большие подматрицы," соответ- соответствующие связи одной полосы с другой, пусты. С количеством полос, пропорциональным /г-1'2, потребности в памяти состав-- ляют O(N514) — не оптимальная величина, но это на Nlli лучше, чем в прямом ленточном алгоритме, требующем Nw = N3>2 ячеек. Для трехмерных задач ситуация сохраняется. Любой из этих алгоритмов (очевидно, остается еще обшир- обширное поле для дальнейших исследований) в процессе исключения дает решение системы KQ = F. После этого аппроксимация ме- метода конечных элементов найдена. 1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ Как близка аппроксимация Ритца uh к точному решению м? В соответствии с приведенной теоремой, утверждающей, что энергия ошибки и — uh минимальна, эта аппроксимация близка насколько возможно. Таким образом, метод Ритца оптимален при условии, что энергия измеряется' естественным образом. Измерение должно быть связано с особенностями задачи, т. е. с функционалом I(v): энергия v — член второго порядка в I{v). (Наше определение отличается от физически корректного мно- множителем '/г, но нам удобно игнорировать этот множитель.)

54 1. ВВЕДЕНИЕ В ТЕОРИЮ Итак, если функционал записан в виде I(v) = a(v,v)-2(f,v), A9) то энергия функции v задается величиной a(v, v). Энергия соответствует члену, который до сих пор имел вид (Lv,v) и интегрировался по частям. Это интегрирование при- приводит к более симметричному выражению — симметрия подчер- подчеркивается видом a(v,v). В частности, если (Lv,w) проинтегри- проинтегрировать по частям, получим симметричное выражение я a (v, w) = \ (р (х) v' (х) w' (х) + q (x) v (x) w (х)) dx. о Это энергетическое скалярное произведение. Оно определено для всех v и w в допустимом пространстве Ж\ и представляет собой скалярное произведение, «внутреннее» для данной задачи. Наша цель в этом разделе состоит в доказательстве тео- теоремы, утверждающей, как сказано выше, что энергия ошибки в методе Ритца минимальна, и в применении ее для установле- установления границ ошибки при аппроксимации линейными элементами. Теорема 1.1. Предположим, что и минимизирует I (v) на всем допустимом пространстве ЖХе, a Sh — его замкнутое подпрост- подпространство. Тогда а) минимум I(vh) и минимум а(и— vh, и — vh), где vh про- пробегает подпространство Sh, достигается на одной и той же функ- функции uh, так что а{и — uh,u — uh) = min a{u — vh,u — vh); B0) б) по отношению к энергетическому скалярному произведе- произведению uh есть проекция и на Sh, или, что то же самое, ошибка и — uh ортогональна Sh: а (и — uh, vh) = 0 для всех vh <= Sh; 'B\) в) функция uh, на которой достигается минимум, удовлетво- удовлетворяет условию . а (и'\ vh) = (f, vh) для всех vh e= Sh; B2) в частности, если Sh — все пространство Ж\, а (и, v) = (f, v) для всех oel^. . B3) Следствие. Из B1) следует, что а(и — uh, uh) = 0, илиа(и, uh) = = a (uh, uh), и в силу теоремы Пифагора энергия ошибки равна ошибке в энергии: а (и — и*, и — uh) = a(u,u) — a (u\ uh).

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 65 Далее, так как левая часть неотрицательна, энергия деформа- деформации в uh всегда мажорируется энергией деформации в и: a (uh, uh) < а {и, и). B4) Это теорема основная в теории метода Ритца, и три ее части тесно связаны. Утверждение (б) непосредственно вытекает из (в): если равенство B3) справедливо для всех о, то оно спра- справедливо и для o'eS'; вычитая из него B2), получаем B1). Утверждение (б) вытекает из (а): в пространстве со ска- скалярным произведением функция из подпространства Sh, бли- ближайшая к заданной функции и, всегда является ее проекцией на Sh. Обратно, покажем, что (а) вытекает из (б): а (и - uh - vh, и - uh — vh) = = a(u — uh,u — uh) — 2a(u — uh, vh) + a(vh, vh). Если справедливо равенство B1), то a(u — uh, и — uh)^a{u — uh — vh, u — uh — vh). Равенство возможно, только когда a(vh, vh) = 0, т. е. когда vh = 0. Таким образом, uh — единственная функция в B0), и утверждение (а) доказано. Осталось доказать утверждение (в) — из него вытекает (б), откуда в свою очередь следует (а). Если uh минимизирует / на Sh, то для всех г и vh I (и11) < / (uh + evh). Правая часть есть а (и11 + &vh, uh + evh) - 2 (f, uh + &vh) = = / (uh) + 2e [a (u\ vh) - (f, vh)} + e2a {v\ vh). Поэтому 0 < 2e [a (u\ vh) - (f, vh) ] + e2a (v\ vh). Так как это верно для сколь угодно малого числа е любого знака, то a{uh,vh) = (f,vh). Последнее уравнение выражает ра- равенство нулю первой вариации функционала 1 в точке uh в на- направлении vh. В частности, а(и, v) — (f, v), и первая вариация в и равна нулю в любом направлении v. Мы получили уравне- уравнение A1), выведенное ранее. Таким образом, утверждение (в) доказано; соотношение B3) дает уравнение виртуальной ра- работы. Если в этом уравнении положить v = и, получим интерес- интересный результат: в точке минимума энергия деформации равна потенциальной энергии с обратным знаком: 1(и) = а (и, и) - 2 (f, и) = - а (и, и). B5)

56 1. ВВЕДЕНИЕ В ТЕОРИЮ Аналогично l(uh)= —a(uh,uh). В любом случае I(u)^.I(uh), так как и доставляет минимум на более широком классе функ- функций, и потому изменение знака приводит к результату, сформу- сформулированному в следствии: энергия деформаций всегда оцени- оценивается сверху, а(и\ы*)< а (и, и). Теорема теперь доказана, за исключением одного пункта: ни существование, ни единственность uh (когда Sh — все простран- пространство Же, самого решения и) не обоснованы. Д*ля специалиста по функциональному анализу это означает, что доказательство только начинается. Попытаемся его успокоить, указав основное предположение теоремы: подпространство Sh должно быть замкнуто, т. е. оно должно содержать все предельные функции. Если последовательность vN в Sh такова, что а (оN — vM, vN — vM) -* 0 при N, М -> оо, то в Sh найдется функция v, для которой a(vpf~r- v, vN — v)-*¦ 0 при N-+°o. Это всегда верно, если Sh конечномерно; именно этот случай рассматривается в методе Ритца. Вообще говоря, нельзя гаран- гарантировать существование функции uh^Sh, ближайшей к и, не предполагая замкнутости подпространства. Приведем в каче- качестве примера случай Sh = ^\, подпространство М\ не замк- замкнуто. Оно содержит функции, сколь угодно близкие к и(х) = х, но ближайшей нет, проекции и(х) на Ж% не существует. Для того чтобы доказать существование функции и, опреде- определенной как минимизирующая функция на всем пространстве 3$е, надо считать пространство Ж\ замкнутым. Это как раз то. чего мы добились, -пополняя Ж\ до Же- В частности, допусти- допустимое пространство становилось полным (или замкнутым), когда отбрасывалось естественное краевое условие м'(я)=0. Была, правда, одна техническая деталь, которую мы использовали: пространство было пополнено в естественной энергетической норме, a(v — vN, v — vN)-+0, как в A0), а чуть раньше мы опи- описали пополненное пространство в терминах ^'-нормы. Эти два подхода оправданы эквивалентностью двух норм: существуют такие постоянные а и К, что a(v, v)^K\\vf[, B6a) a(v, t>)><TlMli- B6b) Последнее неравенство также дает единственность и и uh, так как оно означает, что энергия положительно определена:

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 67 a(v,v) = 0 тогда и только тогда, когда v = 0. Поверхность l(v) строго выпукла и имеет лишь одну стационарную точку — точку минимума. Первое неравенство очевидно, поскольку [р {v'f + qv2] rfx < max(р (х), q{x))\[{v'J + v2} dx. Таким образом, в качестве К можно взять тах(р, q). Доказательство неравенства B6Ь) в другую сторону начи- начинается так же, поскольку величина р ограничена снизу поло- положительной ПОСТОЯННОЙ p {v'f dx^p min jj {v'f dx. B7) Трудности появляются в членах нулевого порядка, так как величина q не обязательно отделена от нуля; в самом деле, мо- может оказаться, что q = 0. Поэтому нам нужно неравенство типа Пуинкаре, с оценкой v через v'. С учетом краевого условия у@) = 0 естественно написать v {x0) =}v' {x) dx о и применить неравенство Шварца Интегрируя по отрезку 0 sg: х0 ^ я, приходим к неравенству Пуанкаре Теперь, учитывая правую часть в B7), находим, что \ р {v'f + qv2 > pmln \ {v'f > Jp- pmln \ {v'f + Это и есть требуемое неравенство a{v, v)"^ a\\v\\2p доказываю- доказывающее эллиптичность нашей задачи. Вместе с B6а) оно означает, что пополнения пространства Ж\ в обычной норме ||f||i и в энергетической Vй (w, v) совпадают; этим общим простран- пространством является Ж\. Заметим, что при естественных краевых условиях на обоих концах интервала ситуация совсем другая. Неравенство Пуан-

58 1. ВВЕДЕНИЕ В ТЕОРИЮ каре зависит от условия о@) = 0 и нарушается для каждой по- постоянной функции. При v = const и q = 0 энергия a(v,v) = = \ р (v'J может равняться нулю и без требования v = 0. Со- Соответственно решение дифференциального уравнения не единственно; и определяется с точностью до постоянной. Та- Таким образом, задача Неймана в чистом виде — физически это задача, где возможны жесткие перемещения тела — может при- привести к техническим трудностям: квадратичная форма a(v,v) будет не определена. Теперь об общей теории. Наша цель — продемонстрировать ее на примере конечных элементов, когда подпространство Sh составлено из кусочно линейных функций, и оценить ошибку eh = u — uh. Ключ к решению дает свойство минимизации B0): a {eh, eh) < а (и — ой, и — vh) для всех vh e= Sh. Разумеется, функция и неизвестна. Можно только утверждать, что если / принадлежит [email protected]°, то а принадлежит Ж\. Поэтому во- вопрос таков: насколько хорошо можно аппроксимировать произ- произвольную функцию и е Ж\ элементами из Sh? Нам не обяза- обязательно работать здесь с аппроксимацией Ритца uh, достаточно найти в Sh хорошую аппроксимацию функции и, а ы'1.будет еще лучше. Таким образом, оценка ошибки eh приводит непосред- непосредственно к задаче аппроксимации: насколько далеки от )$h функ- функции из пространства Ж% в естественной норме -y/a(v, и)? Удобнее всего взять в качестве функции из Sh, близкой к и, ее интерполянт и}. Обе функции, и и и}, совпадают во всех уз- узлах х = //г, и Ui линейна между узлами. Ее можно записать в виде комбинаций функций-крышек: N "/ (х) = Z и (ih) ф* (*). В каждом.узле только одна соответствующая базисная функция Ф? отлична от нуля. Сравним и и иг сначала на основе простых разложений в ряд Тейлора, дающих поточечную оценку разности функций. Теорема 1.2. Если вторая производная и" непрерывна, то maxj и (х) — ы7 (*) К у /г2 max | и" (х) \ B8) и max| и'(х) -ufi(x)\<hmax| и"(х) |. B9)

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 59 Доказательство. Рассмотрим разность А(х)= и(х) — — Uj(x) на интервале (/—\)h^.x^.jh. Так как на концах интервала А обращается в нуль, найдется по крайней мере одна точка z, для которой A'(z) = 0. Тогда X А' (*)= \ А" (У) dy Для всех х- линейна; отсюда сразу по- Но А" = ы", поскольку функция лучаем B9): X \u"(y)dy <Amax|u"(*)|. Максимум величины |A(x)| может достигаться только в точке, где производная равна нулю, A'(z)=0. Посмотрим, в какой и(х)=х и(х) =x(h-x)//z Zh Рис. 1.5. Экстремальный случай при кусочно линейной аппроксимации. половине интервала лежит г; пусть г, например, ближе к пра- правому концу интервала, т. е. jh— г ^ /г/2. Разложим в ряд Тей- Тейлора в точке z: A (jh) = A (z) + (jh - z) A' (z) + 1 (jh - zf А" И, где г < ад < /А. Так как А = 0 на концах интервала jh и А" — Л (z) | == 4-(/А - zJ А" (да) < 4" A2 max | и" |. = и", то Постоянная 1/8 неулучшаема, и не только для ошибки линей- линейной интерполяции, но и для произвольной кусочно линейной аппроксимации. Вторая производная и" от функции, где ап- аппроксимация хуже всех, меняется от +1 до —1 на соседних интервалах (рис. 1.5). Наилучшая кусочно линейная аппрокси- аппроксимация в этом экстремальном случае — тождественный нуль, и ошибка составляет /г2/8. Более подробное доказательство неравенства B9) улучшило бы оценку до тах| Д'| sg: A/2)Атах|ы"|, и экстремальная функ-

60 1. ВВЕДЕНИЕ В ТЕОРИЮ ция, изображенная на рис. 1.5, также показывает, что постоян- постоянная 7г — наилучшая из возможных. Из теоремы следует, что если вторая производная и" непре- непрерывна, то я а (и — щ, и — и/) = J р (А'J + ?Л2 < С/г2 max | и" |2. Так как аппроксимация Ритца uh приближает и не хуже, чем Ui, ошибка в энергии при аппроксимации линейными элемен- элементами удовлетворяет неравенству a(u~uh,u- uh) <Ch2 max| и" |2. Это уже почти тот результат, какой мы хотим получить. Мно- Множитель К1 совершенно правильный, он отражает скорость убы- убывания ошибки, когда сетка сгущается. Неточность оценки от- отражает другой множитель, тах|м"|2. Он не удовлетворителен, так как нужно предполагать непрерывность второй произ- производной и" или даже ее ограниченность, а нам достаточно было бы работать в предположении, что и" обладает 'конечной энер- энергией в 5^°-норме, т. е. \ {и"Jdx < оо. Доказательство этого бо- более точного результата в примере с линейной интерполяцией основано уже на разложении Фурье, а не Тейлора. Оценка ошибки дана ниже в C4). Теорема 1.3. Если и" принадлежит Ж0, то II« - «/Но <^ Л2 II«" Но,, . C0) a{U-U,,U- Ui) < (jp Ртах + ^ ?тах) II W ||2. C2) Доказательство. Рассмотрим какой-нибудь интервал длины h, например первый: 0 sg: х sg: h. Разность k(x)= u(x) — — W/(x) равна нулю на концах интервала; представим ее в виде разложения Фурье по синусам:

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 61 Непосредственные вычисления дают о о Так как п ^ 1, то Поэтому, суммируя по п, получаем л а л |^"J. C3) Здесь А" = м", поскольку функция иг линейна. Равенство до- достигается тогда и только тогда, когда все коэффициенты ап, кроме первого, равны нулю, т. е. разность А должна иметь вид sin nx/h. Неравенство C3) справедливо на каждом подынтервале, скажем на (/'—l)h^.x^ih, так что можно просуммировать по всем подынтервалам: N ih N ih 1 U-l)h 1 (/ -1) Л Мы хотим упростить это неравенство до Этот шаг, который выглядит вполне очевидным, оправдан только тем, что нет никаких неприятностей в точках стыковки подынтервалов. Отметим, что если бы функция А" стояла справа, как в C3), то равенство /л л ' ^ J (А"J =5 (А"J </-i)ft о было бы неверным, так как правая часть в действительности может оказаться бесконечной (А" является 6-функцией в уз- узлах). Эта ситуация возникнет снова, когда мы будем анализи- анализировать разницу между согласованными и несогласованными

62 I. ВВЕДЕНИЕ В ТЕОРИЮ элементами; если пробные функции не принадлежат допусти- допустимому пространству, то I(v) нельзя вычислить на каждом эле- элементе. По тем же соображениям откуда а (А, А)== я ^ Ршах + -ф <?max) J {U Теорема доказана. Другой вывод неравенства C3) (без разложения в ряд Фурье) основан на вариационной задаче: найти максимум ((А'J при ограничениях Д@) = Д(Л) = 0, ^(Д"J=1- Стацио- Стационарными точками будут А = sin плх/h и экстремум достигается на функциях sinnx/h. Интерполянт ut не следует путать с аппроксимацией Ритца Ф. Обе функции кусочно линейны, но uh определяется вариа- вариационно, в то время как Uj— всего лишь удобно выбранная близ- близкая к и функция. Теорема 1.1, утверждающая, что uh лежит к и еще ближе, дает первое из неравенств C4). Следствие. Ошибка eh — и — uh метода конечных элементов удовлетворяет неравенствам а {е\ eh) < С,/г21| и" |g < С?Л21| f |g. C4) Второе неравенство вытекает из C), где решение оцени- оценивается через правую часть уравнения. В постоянных С\ и С2 основные члены ртах/я2 и pmax/n2p^ln соответственно. Окончательный результат —оценка порядка h2 для ошибки б энергии. Практические вычисления показывают, что эта оценка подтверждается, и ошибка а(и — uh,u — uh) почти про- пропорциональна h2, начиная уже с очень грубых сеток (h = у2 или 'Д?)- Такую регулярность можно объяснить асимптотиче- асимптотическим поведением ошибки, которое было введено для разност- разностных уравнений в A6). Теорема сходимости доказывалась в предположении, что и обладает двумя производными, поэтому исключался случай,

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 63 когда / есть 6-функция, а решение и имеет излом. Простые вы- выкладки показывают, что порядок окончательной ошибки в энер- энергии в этом случае равен h, если узел не расположен в точке разрыва функции /. (В случае двух переменных при разрыве вдоль прямой сходимость будет также порядка О(h).) Вообще, если функция и принадлежит только Ж\, о скорости сходимо- сходимости сказать ничего нельзя, она может произвольно уменьшаться при h -> 0. Однако сходимость все-таки есть, это легко доказать. Теорема 1.4. Для решения и из пространства Же, т. е. для соответствующих правых частей f, метод конечных элементов сходится-в энергетической норме a(eh, eh)-+0 при Доказательство. Так как пространство Же было по- построено как пополнение пространства Жв, найдется последова- последовательность vN из Ж%, сходящаяся в энергетической норме к и. Для каждого фиксированного индекса N аппроксимация по ме- методу конечных элементов vhN сходится к vN при h -> 0 (тео- (теорема 1.3). Поэтому, если 'выбрать N достаточно большим, a h достаточно малым, функция vhN из Sh будет произвольно близка к и. Так как проекция uh будет еще ближе, последова- последовательность uh должна сходиться к и. Это доказательство применяется без всяких изменений ко всем таким задачам минимизации, и нет нужды повторять его в каждом случае. Необходимое и достаточное условие для схо- сходимости метода Ритца очевидно: для всякой допустимой функ- функции и ее расстояние до пространства пробных функций Sh (из- (измеренное по энергии) должно стремиться к нулю при А->0. Из доказательства предыдущей теоремы видно, что эту сходи- сходимость можно проверять на плотном подпространстве, т. е. та- таком, пополнение которого в энергетической норме включает все допустимые функции; сходимость тогда будет автоматически следовать для каждой функции и. Однако интересно установить скорость сходимости в энергетической норме в случае, когда и — достаточно гладкая функция. Интересно также, но несколько труднее, найти скорость схо- сходимости в- другой норме. Согласно следствию, напряжения, т. е. первые производные {uh)r, имеют ошибку порядка O(h). Ка- Какова ошибка перемещения? Насколько быстро убывает eh = = и — uh по норме II eh Но? Приблизительно на этот вопрос можно ответить, вспомнив неравенство Пуанкаре | eh(xQ) I ^ У я ||eft||1; выведенное выше. Границы ошибки в каждой точке хо будут равномерно иметь

64 1. ВВЕДЕНИЕ В ТЕОРИЮ порядок O(h). Можно, однако, улучшить эту оценку до O(h2). Как это сделать, хорошо видно из C0), где ошибка при интер- интерполировании элементом и} второго порядка точности. Это по крайней мере доказывает, что Sh содержит функции, отличаю- отличающиеся от и на О (/г2) по перемещению. Трудность состоит в том, что в Ж°-норме аппроксимация Ритца uh уже не обладает ми- минимизирующим свойством, и нет уверенности, что uh ближе к «, чем Ui. В дальнейшем мы рассмотрим задачу четвертого по- порядка, в которой ошибка по перемещению не лучше, чем по наклону. В примере, который мы рассматриваем сейчас, ошибка по перемещению действительно составляет O(h2). Одно из воз- возможных доказательств — забыть о вариационном происхожде- происхождении уравнений KQ = F метода конечных элементов и вычис- вычислить из них ошибку отсечения как из разностных уравнений (на границе х = я это уже сделано). Применяя принцип мак- максимума, мы действительно получаем поточечную оценку | eh (х) | = О (/г2), которая оптимальна. Но этот подход не пол- полностью удовлетворителен, так как распространение его на не- нерегулярные конечные элементы в задачах с двумя переменными вызывает огромные трудности. Поэтому важно найти соображе- соображения, позволяющие установить вариационно скорость сходи- сходимости ошибки по перемещению || eh Ho- Следующий прием приводит к успеху: пусть z— решение исходной вариационной задачи на Ж\, в которой ошибка eh = = и — uh выбрана в качестве правой части. Приравняем нулю первую вариацию: a(z, v) = (eh, v) для всех v <= Же- C5) В частности, можно положить v = eh; тогда а (г, еЛ) = ||еЛ||2. C6) С другой стороны, в теореме 1.1 утверждается, что a(vh, eh) = 0 для всех vh^Sh. Вычитая из C6), получаем a(z~vh, й*)«=||е*||2. _ C7) К левой части применим неравенство Шварца в энергетической норме: \a(v, w)\^(a(v,v))l'*(a(w, w)f при у = 2 — vh, w,= eh. Согласно следствию из теоремы 1.2, (а (е", <*))*< СА|| и" ||„.

1.6. ОШИБКИ АППРОКСИМАЦИИ ЛИНЕЙНЫМИ ЭЛЕМЕНТАМИ 66 Если выбрать vh как аппроксимацию Ритца функции г, то, со- согласно тому же следствию, {a{z-v\z-vh))k<sCh\\z"\\Q. Таким образом, применение к C7) неравенства Шварца дает Наконец, можно оценить решение z через правую часть eh; в силу неравенства C) Это ключевой момент: чтобы оценить ошибку eh метода Ритца в <3^°-норме, что в. вариационном смысле неестественно, потре- потребовалось оценить решение в, <?^2-норме, что также неестественно. Последняя оценка, однако, совершенно естественна с точки зре- зрения дифференциальных уравнений: действительно, основной результат теории состоял в том, чтобы оценить решение в тер- терминах пространства Ж2 по правой части из Ж0. Подставляя эту оценку в предыдущее неравенство и сокращая на общий множи- множитель || eh Но, приходим к оценке h2 для ошибки по перемещению (такой подход в литературе по численному анализу известен как прием Нитше): Теорема 1.5. Кусочно линейная аппроксимация uh no методу конечных элементов, полученная, из теории Ритца, удовлетво- удовлетворяет неравенствам \\u-uh ||0 < рС2Л21| и" Но < p2C2h21| / |Ь. C8) Интересно, что для вывода этой оценки не применялся непо- непосредственно факт возможности аппроксимации порядка К1 в <3^°-норме. Этот факт, таким образом, можно считать след- следствием теоремы: если Sh дает аппроксимацию порядка O(h) в Ж, то в Жй достигается аппроксимация O(h2). Отметим, что скорости убывания ошибок — h2 для переме- перемещения и h для напряжения — опять-таки подтверждаются чис- численным экспериментом. Многие экспериментаторы подсчиты- подсчитывали ошибки только в отдельных узлах сетки вместо средне- среднеквадратичных ошибок на интервале и получили те же самые скорости сходимости. (Чтобы предсказать поточечные ошибки, мы должны вернуться к принципу максимума или предполо- предположить большую гладкость данных в среднем и улучшить вариа- вариационную оценку. В некоторых важных задачах решение по ме- методу Ритца действительно точнее всего в узловых' точках; на- например, для —и" =. /, и @) = и (л) = 0 функция uh совпадает 3 Зак. 287

66 Т. ВВЕДЕНИЕ В ТЕОРИЮ в узлах сии точность бесконечна.) Бывают, однако, случаи, в которых ожидаемая сходимость не подтверждается из-за про- простого просчета в эксперименте: ЭВМ работает с величиной ?A = max \eh{jh)\. При убывании h количество точек сетки, входящих в эту фор- формулу, растет. В частности, появляются точки ближе к границе, где ошибка часто наибольшая, и эти точки начинают определять численную величину Eh. Конечно, нет никаких оснований счи- считать, что эта ошибка будет убывать к нулю с оптимальной ско- скоростью Л2. Наконец, исследуем ошибку, возникающую при замене функ- функции нагрузок / ее линейным интерполянтом /7. В результате этой замены, производимой для упрощения интегрирования yfqfdx, вектор нагрузок F заменяется на F. Это приводит в свою очередь к приближенному решению по методу конечных элементов Q = K~lF, йА = 2Q/ф?, представляющему собой точ- точную аппроксимацию по методу конечных элементов задачи с правой частью /7. Поэтому мы рассмотрим сейчас лишь изме- изменения в решении по методу Ритца при изменении правой части. Теорема 1.6. Ошибка uh — uh в решении по методу конечных элементов, возникающая при замене функции f ее линейным интерполянтом /7, удовлетворяет неравенству а{ин-й\ и*-й*)<-5?-А*|1НК. Доказательство. Точное решение и — п задачи с пра- правой частью / — fi удовлетворяет неравенствам 11«-й||2<р||/-//|1о<^Л2ИП1о. C9) В последнем неравенстве учтена оценка ошибки линейной ин- интерполяции, взятая из теоремы 1.3. Далее, а(и-й, и - й)^К\\и - й\\\^К\\и - u\P2^-^-h'\\f"\\l. (Мы не смогли использовать самую сильную часть неравенств C9), а именно, что даже вторая производная от и — й имеет порядок 0{h2).) Доказательство заканчивается применением следствия из теоремы 1.1: uh — пн есть проекция функции и — п на Sft, а про-

1.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 67 ектирование на Sh не может увеличить энергию: a {uh — йА, uh — йА) = а {и — п, и — и) — -a{{u-u)-{uh-uh), {u-u)-{uh-uh))^ Таким образом, ошибка аппроксимации Ритца при интер- интерполировании правой части меньше (/г4 в смысле энергии), чем ошибка h2 в методе Ритца при аппроксимации линейными эле- элементами. 1.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ ' В ОДНОМЕРНОМ СЛУЧАЕ Этот раздел обобщает предыдущий в трех направлениях: здесь вводятся неоднородные краевые условия, рассматриваются квадратичные и даже кубические элементы, а не линейные, и решаются дифференциальные уравнения четвертого порядка, а не только второго. Оценки ошибок для различных конечных элементов часто приводятся без доказательств, так как они вы- вытекают из теории, которая будет развита далее в этой книге. Этапы метода конечных элементов те же, что и прежде: вариа- вариационная постановка задачи, выделение кусочно полиномиаль- полиномиальных подпространств в некотором допустимом пространстве, по- построение и решение линейных уравнений KQ = F. Эта схема в одномерном случае более или менее закончена. Начнем с изучения-того же дифференциального уравнения — {ри'У — qu = f, но с краевыми условиями более общего вида [email protected]) = g, и' (я) + аи (я)~Ъ. Первое из условий по-прежнему главное, и ему должна удо- удовлетворять каждая функция v из допустимого пространства Ш\. Поэтому разность между двумя допустимыми функциями v0 = = v\ — v2 будет удовлетворять однородному условию уо@) = 0. Обозначим через Vo пространство таких разностей ц0", это допу- допустимое пространство в случае однородного главного условия. Краевое условие на другом конце выглядит теперь по-но- по-новому; оно содержит и' и и, и потому функционал I(v) надо вы- вычислить заново. Физически система представляет собой стру- струну, которая не фиксирована и не свободна полностью в точке

68 1- ВВЕДЕНИЕ В ТЕОРИЮ х = л. Новый функционал имеет вид я / (у) = J (р (у'J + qv2) dx + ар (л) vl(л) - о я -2<\j-fvdx-2bp{n)v{n). Таким образом, новые краевые условия входят как в линейную часть функционала, так и в энергию a (v, v)=\(p {v'f + qv2) dx + ар (л) v2 (л). Последний член представляет собой энергию струны. Проверим, что равенство нулю первой вариации в каждом направлении v0 приводит к тем же условиям на точку мини- минимума и, что и дифференциальное уравнение вместе с краевыми условиями. (Заметим, что и изменяется функцией v0 из Vo, обеспечивающей выполнение главного краевого условия (и + evo) @) = g. Измененная функция не принадлежит ЖХе). Коэффициент при 2е в 1{и + ewo) есть \pu'v'Q + quv0] 4- ар (я) и (л) v0 (л) — $ f и0 — 6р (я) и0 (я) = = \ [ -(pu'Y + qu-f]vo+p (л) [и' (л) + <ш (л) - Ь] v0(л). Это выражение равно нулю для всех v0 тогда и только тогда, когда и удовлетворяет дифференциальному уравнению и новым краевым условиям. Поэтому краевое условие — естественное для измененного функционала /(о)/' В общем методе Ритца больше нет смысла задавать себе вопрос, является ли Sh подпространством в Же, так как Же — это уже не векторное пространство, оно сдвинуто относительно нуля. По этой причине пусть Sh имеет тот же вид, что и прежде. Пробные функции vh не должны лежать в допустимом простран- пространстве Же, но их разности обязаны лежать в пространстве Уо функций с однородным условием. Эти разности v^ = v^~ v\ образуют конечномерное пространство SJ, которое должно быть подпространством в Vo. Для линейных конечных элементов все очень просто. В точке х = я никаких ограничений нет, там краевое условие естест- естественное. Пространство пробных функций Sh будет состоять по- поэтому из всех кусочно линейных функций, удовлетворяющих

T.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 69 условию [email protected]) — g. (Главному краевому условию можно удов- удовлетворить точно в одномерном случае, так как vh «зажата» только в точке. В случае двух и более переменных краевое усло- условие vh(x, у) = g(x, у) не удовлетворяется полиномами и Sh не содержится в Же-) So есть пространство кусочно - линейных пробных функций, равных нулю в точке х = 0, и каждую функ- функцию vh можно записать в виде Коэффициент при ф? фиксирован: qo = g. Потенциальная энергия I(vh) представляет собой квадра- квадратичный функционал неизвестных qu q2, ..., qN и его минимиза- минимизация приводит опять к линейной системе KQ = F. Внутри интер- интервала, т. е. для всех строк матрицы, кроме первой и последней, эта система такая же, как в предыдущем разделе. Первая стро- строка матрицы, соответствующая левому концу интервала, похожа на все другие строки, за исключением того, что qo = g1)- По- Поэтому первое уравнение системы (с коэффициентами р = q = 1) выглядит так: Если перенести члены" с g в другую часть уравнения, первая строка матрицы К будет в точности той же, что и раньше. Неод- Неоднородное условие изменяет только первую компоненту F\ век- вектора нагрузок на величину g/h — gh/6r Для другого конца вычисления почти так же просты. Новые члены в I(vh) таковы: ар (я) (t>" (я)J - 2Ър (я) t>" (я) = ар (я) q% - 2bp (я) qN. Поэтому в последнем уравнении dI/dqN = 0 после сокращения на 2 к компоненте FN вектора нагрузок добавится Ьр(л), а в элемент ^Слглг матрицы жесткости войдет ар(я). Такие малые изменения объясняются локальностью базиса: только одна ба- базисная функция (последняя) не равна нулю в точке х = л и именно она связана с краевым условием. 1) Это соответствует способу, которым главное краевое условие вводится на практике. Его игнорируют при построении матрицы, а потом неизвестной (в нашем случае qo) приписывают значение, которое берется из краевого усло- условия.

70 1 ВВЕДЕНИЕ В ТЕОРИЮ Оценка ошибки для этой задачи та же, что и в предыдущем разделе: а(и-и\ u-u*) = O(A2) Первая оценка опять связана с вариационной теоремой: и бли- ближе к Ф, чем к иг. В свою очередь это зависит от того, принад- принадлежит ли линейный интерполянт иг пространству пробных функ- функций Sh. Поэтому можно опять все свести к теореме 1.3, дающей оценку расстояния между функцией и ее интерполянтом. Второе обобщение метода состоит во введении более «точ- «точных», чем кусочно линейные функции, элементов. Заданная функция и{х) лучше аппроксимируется квадратичными или ку- кубическими интерполянтами, чем линейными, и это приводит к соответствующему улучшению точности Ф. Поэтому естественно строить пространство пробных функций Sh с помощью полино- полиномов высших степеней. Мы начнем с предположения, что Sh состоит из всех кусочно квадратичных функций, непрерывных в узлах х = jh и удовлет- удовлетворяющих условию vh,@) = g. Прежде всего вычислим размер- размерность пространства Sh (число свободных параметров q^) и определим его базис. Заметим, что если х попадает в узел, не- непрерывность налагает только одно ограничение на параболу, начинающуюся в этом узле; два параметра пар-аболы остаются свободными. Поэтому размерность должйа быть вдвое больше числа парабол, т. е. 2N. Базис можно построить, вводя в дополнение к узловым точ- точкам х = jh средние между узлами точки х = (/—1/2)h. Тогда узлов будет 2N, поскольку х — 0 исключается и Nh = n; будем обозначать эти узлы Zj, /=1,2, .... 2N. Каждому узлу соот- соответствует непрерывная кусочно квадратичная функция, равная 1 в Zj и 0 в Zi, i Ф /: Ф/B() = 6г/. D0) Эти функции будут двух типов в зависимости от того, была ли точка Zj узлом (рис. 1.6, а) или средней между узлами (рис. 1.6,6). Отметим, что обе функции непрерывны и принад- принадлежат Ж\. Функция ф2, не равная нулю только на одном подынтервале, не определяется внутренней структурой подпро- подпространства, промежуточный узел можно выбрать где-нибудь на интервале. Выбор средней точки влияет на базис, но не на само пространство. Матрица жесткости элемента k\, соответствующая интегралу от (и'J по отрезку 0 ^ х ^ h, вычисляется по трем значениям

1.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 71 параболы: qo при х = О, q^ в средней точке х = /г/2 и qi при х = h. Такая парабола имеет вид ^ (*) = <?о + Т DЧ ~ <?. - 3О + (I)' B<?. + Ч - 4<7,/2). Чтобы выразить ее через базисные функции, найдем коэффи- коэффициенты ПрИ <7о, <?1/г И <?1: Эти три коэффициента точно описывают три параболы на рис. 1.6: коэффициент при qo — правую половину графика функ- функции ф! на рис. 1.6, а (равной 1 при х = 0 и 0 при х = /г/2, x=h), (х>) + z(x/h)\ 1 - з (x/h) + г (x/hJ f(x/h Рис. 1.6. Базисные функции кусочно квадратичных элементов. коэффициент при q^ — параболу ф2, изображенную на рис. 1.6,6, и коэффициент лри q\ — левую половину графика функции фЬ Для вычисления матрицы k\ надо проинтегрировать (dvh/dxJ и затем выписать результат в виде (<?o<?v2(?i)T^i (<7o<7y2Gi)- Отме- Отметим, что k\ имеет размер 3X3, так как на каждом фиксирован- фиксированном интервале появляется 3 параметра q; парабола опреде- определяется тремя условиями. Опуская вычисления, которые каждый может проделать сам, дадим только окончательный результа'т: 7-8 Г =i -8 16 ~8 Заметим, что матрица k\ вырождена; после умножения ее на вектор A, 1, 1) получается нуль. Вектор qQ = 1, qy2 = 1, qx = 1 соответствует параболе vh, вырожденной в горизонтальную пря- прямую vh н= 1, так что ее производная равна нулю. Вырождение

72 1. ВВЕДЕНИЕ В ТЕОРИЮ матрицы k\ — это незначительное препятствие: не должна быть вырождена матрица ko. Описанные идеи непосредственно распространяются на куби- кубические элементы. Непрерывность пробных функций налагает одно ограничение в каждом узле х = jh, оставляя 3 параметра кубического элемента свободными, поэтому-размерность прост- пространства Sh равна 3N. Для построения базиса введем два узла внутри каждого интервала, скажем, на расстоянии /г/3 от его концов. Вместе со старой сеткой это дает 3N узлов г$ = /А/3. Функции ф3-, удовлетворяющие условию (pj(zj=8ij, образуют базис и могут быть трех типов (рис. 1.7). Матрицы элементов будут иметь порядок 4. о Рис. 1.7. Кубические элементы, только непрерывные в узлах. Есть и другие кубические элементы, лучшие почти во всех отношениях. Для их построения требуется непрерывность не только самих функций vh, но и их первых производных. Это означает, что пробное пространство в данном случае действи- действительно является подпространством рассмотренного выше про- пространства пробных функций: налагается по одному новому огра- ограничению в каждом из N—1 внутренних узлов х = А, 2А, ... ..., я — А. Поэтому размерность нового пространства будет ЗЛ/—(N—1) = 2Л/+1- Число параметров, которые нужно вы- вычислять, уменьшилось на одну треть. Единственный случай, когда введение нового пространства кубических элементов не улучшает аппроксимацию решения и, это случай, когда и не имеет непрерывную производную. В разд. 1.3 мы видели, что это происходит — и принадлежит Же, но не Ж% — в случае точечной нагрузки или разрывного коэффициента р(х) в диф- дифференциальном уравнении. В такой ситуации существенно не требовать гладкости пробных функций. Особую точку Хо надо поместить в узел, и в нем кубический элемент должен быть всегда лишь непрерывным. Это позволит сохранить порядок сходимости. Расположение узлов для более гладких кубических элемен- элементов интереснее. В каждой точке х = /Л находится двойной узел. Вместо того, чтобы определять кубический элемент по его зна- значениям в четырех различных точках О, А/3, 2А/3 и А, будем теперь определять его по значениям самого элемента и его

1.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 73 первых производных в обоих концах, т. е. по и0, v'o, у,, v\. Зна- Значения о, и v[ будут совпадать со значениями в следующем подынтервале, так как у и у' непрерывны. Базисные функции будут двух типов (рис. 1.8). Эти функции имеют нули второго порядка на концах (j±\)h. Их называют эрмитовыми кубиче- кубическими функциями; они интерполируют значения функции и ее 'производной. Случай, рассмотренный ранее, связывают с име- именем Лагранжа. о) (ф) -п о Рис. 1.8. Эрмитовы кубические функции: v и о' непрерывны. !)>(*) = (Ы-1JBЫ + 1), «(*) = *( |х|-1)*. Кубический полином на отрезке [О, Л], принимающий четыре наперед заданных значения vOt v'o, о, и v'v имеет вид = v0 + v'ox + Co, + 3uo - v'ih - 2ойА) -fr -2o, + /jy; + /!yo)-?_. D1) Матрицы элементов (четвертого порядка) вычисляются ин- интегрированием, причем q — вектор-столбец (у0, v'0> vv y'j)r: h матрица массы k0: \ (vhf = qTkoq, о h матрица жесткости kx: \((илH2 = матрица изгиба k2: \ {{vh)"f =

74 1. ВВЕДЕНИЕ В ТЕОРИЮ Заметим, что так как Ф принадлежит Ж*, эту технику можно использовать для задач четвертого порядка; здесь нужна мат- матрица изгиба k2. Существует несколько способов организации вычисления матрицы массы ко. Один из лучших состоит в том, чтобы соста- составить матрицу Я, связывающую четыре узловых параметра век- вектора q с четырьмя коэффициентами А =(а0, а\, а%, а3) кубиче- кубического полинома vh: A = Hq, или, с учетом D1), а0 а, а2 а3 = 1 0 3 А2 2 А3 0 1 2 А 1 А2 0 0 3 А2 2 А3 0 0 1 А 1 А2 v'o 01 Интегрирование функции (vhJ сем тривиально: {vhf dx = h A3 2 A3 3 A* 4 A2 2 A3 3 A' 4 A5 5 A3 3 A' 4 A5 5 № 6 A4 ' 4 Л5 5 A6 - 6 A7 7 щх -\- a2x2 -f- Яз*3J сов- Обозначая матрицу в правой части через Л/о, получаем = qTHTN0Hq. Поэтому матрица массы элемента равна Все это легко программируется на ЭВМ. Для матрицы жесткости матрица связи Н между узловыми параметрами q и вектором коэффициентов А остается той же.

IrT. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 75 Единственное различие состоит в том, что J ((ул)'J dx = \ (а, + 2а2х + За3х2J dx = 0 0 0 0 0 ft ft2 ft3 0 ft2 ^ 0 ft3 -^ 4ft3 3ftl A. Матрица жесткости элемента есть k\ = HTN\H. В результате этих вычислений и аналогичных для матрицы k2 получа'ются матрицы (их надо дополнить по симметрии) ft 420 1 30ft 1 156 22ft 4ft2 36 3ft 4ft2 12 6ft - 4ft2 - 54 13ft 156 -36 -3ft 36 -12 -6ft .12 -13ft -3ft2 -22ft 4ft2 3ft -ft2 -3ft 4ft2 6ft 2h9- -6ft * 4ft2 Матрица ko положительно определена, a k\ имеет нулевое соб- собственное значение, соответствующее функции oft==l, т. е- q = (\, 0, 1, 0). Матрица ?2 обнуляет два линейно независимых вектора, так как (vh)" = 0 для каждой линейной функции vh. Новый вектор из ядра матрицы соответствует функции vh(x)=x, т. е. q = @, I, ft, 1). Иногда полезно заменить вырожденные блоки k\ и k2 есте- естественными невырожденными матрицами. Матрицы становятся невырожденными в результате жестких движений тела, т. е. при (vh)' = 0 и (vh)" == 0. Порядки матриц снижаются до 3 и 2 со- соответственно, и теперь они не несут избыточной информации. Обнуление вектора A, 0, 1, 0) матрицей fa естественно, посколь-

76 1. ВВЕДЕНИЕ В ТЕОРИЮ ку соответствует положению струны без напряжения — это при- принимается на веру и не доказывается. Оказывается, что эти «естественные» матрицы могут упростить вычисления для от- отдельной программы, допуская огромное разнообразие элемен- элементов. В этой книге мы сохраним матрицы жесткости в их вырож- вырожденной форме, так как в таком виде они яснее показывают роль всех четырех узловых параметров о0, v'o, v{ и v\. Для того чтобы можно было применить матрицы элементов к задаче —(pu')'-\-qu = f, они должны составлять глобальную матрицу жесткости К. Если предположить, что коэффициенты постоянны, то типичной строкой (чли, вернее, парой строк, по- поскольку каждой узловой точке х, = jh соответствует два неиз- неизвестных и, и и'Л в построенной матрице К будет JL. (_ 36м/-, - ЗА«;_, + 72м, - 36и/+1 + 3A«f+i) + + ^ E4м/-, + 13Аи/'_, + 312м/ + 54м/_! - 13АЙ/_,) = . D2а) 8hu'} - Зм/+, - hui+i) -J|- (- 13м/-! - Zhu'i-\ + 8hui D2b) Интересно рассмотреть это как разностное уравнение. Пред- Предположим, что р=1, <7 — 0и/=1, так что решается дифферен- дифференциальное уравнение ¦—м//=1. Уравнениями метода конечных элемейтов будут _6 и/ + 1-2Ц/ + »/-1 1 »/'+,-»/'-, 5 /г2 "т" 5 2А ' Разлагая в ряд Тейлора, видим, что первое уравнение согла- согласуется с —и" = 1, а второе с —ки'"\\Ъ = 0; это можно вывести дифференцированием первого уравнения. Именно здесь прояв- проявляется, что метод конечных элементов способствует новой и полезной идее обоснования 'техники конечных разностей. Вместо того, чтобы действовать только с неизвестными Uj и получать по одному уравнению в каждой точке сетки, разностные урав- уравнения метода конечных элементов позволяют брать в качестве неизвестных перемещения и наклоны, так как уравнение для

. T.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 77 наклона формально согласуется с продифференцированным ис- исходным уравнением. При этом можно достичь высокой точности аппроксимации не только самой функции, но и производных высших порядков, не отказываясь от локального характера раз- разностного уравнения. Это нововведение годится для неравномер- неравномерных сеток и криволинейных границ. Его можно было бы серьез- серьезно взять на вооружение при исследовании разностных схем, так как здесь — без ограничения на то, что дискретный аналог воз- возник из метода Ритца с полиномиальной аппроксимацией,— можно добиться даже большей эффективности. Пусть для проверки порядка точности эрмитовых разностных уравнений D2) применяется разложение Тейлора. Прежде всего предположим, что о/ = и(УА) + ЕЛ"ея(/А), у; = «'(//0 + 2>е„(/Л), D3) и разложим Vj±\ и v',±l в центральной точке jh; с по'мощью ис- исходного дифференциального уравнения и результатов его диф- дифференцирований можно проверить, что еп='е^ и что эти члены исчезают при «=1,2, 3. Другими словами, эрмитово разностное уравнение имеет четвертый порядок точности. Эта оценка точно совпадает с оценкой, найденной вариационно; и разложение Тейлора, и вариационная оценка разности и — «j давали О (Л2) в линейном случае. В работе [М7] описан один непредвиденный и довольно печальный случай: на границах асимптотические разложения D3) портятся и ошибка метода конечных элемен- элементов не описывается простым степенным рядом по h при h -> 0. Однако она имеет порядок Л4. Рассмотрим еще один важный случай пространства кубиче- кубических элементов, образованного функциями, у которых даже вто- вторая производная непрерывна в узлах. Кусочно кубические функ- функции с непрерывными вторыми производными называются куби- кубическими сплайнами. "Это пространство кубических сплайнов представляет собой подпространство эрмитовых кубических функций с новым ограничением в каждом из N—1 внутренних узлов. Поэтому размерность подпространства сплайнов равна ЗЛ^ — 2(N—1) = Л/-(-2. Это означает, что каждому узлу соот- соответствует одно неизвестное, включая крайние точки xq = 0 (где у0 = 0, а наклон v'o можно считать свободным параметром) и xN+\ = п-\- h (можно в качестве последнего параметра взять v'N\ Во внутренних точках сетки неизвестными являются пере- перемещения Vj, и уравнения метода конечных элементов будут опять выглядеть в точности как уравнения в конечных разно- разностях. Теперь уже не очевидно, какие четыре узловых параметра определяют поведение кубического сплайна на заданном подын-

78 Г- ВВЕДЕНИЕ В ТЕОРИЮ тервале, скажем на (/—l)h ^ x ^ jh. Значения в узлах х$-\ и Xj, принадлежащих подынтервалу, дают только два условия, а другие два надо откуда-то взять. Поэтому в кубических сплай- сплайнах не существует простейшего локального базиса, и поведение vh внутри элемента определяется перемещениями за пределами этого элемента. Действительно, сплайн, равный нулю во всех узлах, кроме одного, не локален: он отличен от нуля во всех подынтервалах между узлами. Для того чтобы вычислять с помощью сплайнов, нужно по- построить один сплайн, равный 1 в начале координат и отличный от нуля на как можно меньшем отрезке (рис. 1.9). Эта функция Рис. 1.9. Кубический В-сплайн: непрерывные вторые производные в узлах. известна под названием базисного сплайна или В-сплайна. Она очень важна в теории сплайнов и относится к одному из многих замечательных открытий Шёнберга. В частности, Шёнберг до- доказал, что каждый кубический сплайн на отрезке [0, я] можно записать в виде линейной комбинации В-сплайнов vh{x)' JV+1 -1 Базисные функции q>* образованы из В-сплайна, изображен- изображенного на рис. 1.9, путем замены переменной х на x/h и переноса начала координат в точку jh: В этом выражении для vh не учтено, что vh обращается в нуль в начале координат. Если q>? и q? — комбинации функций q>^ и q>J, удовлетворяющие этому главному условию, то соответ- • ствующими кубическими сплайнами будут ЛГ+1 о* (д) = qyh ?

1.7. МЕТОД КОНЕЧНЫХ ЭЛЕМЕНТОВ В ОДНОМЕРНОМ СЛУЧАЕ 79 В такой записи система N -\-2 уравнений метода конечных эле- элементов KQ = F имеет в качестве неизвестных q«, ..., qN+\. Не- Неизвестное qN+i появляется потому, что естественное краевое условие не налагает никакого ограничения в вариационной фор- формулировке; было бы интересно выяснить, как действует это условие на uh, и таким способом избавиться от последней неиз- неизвестной. Вероятно, действие это убывает по экспоненциальному закону. Последние два замечания о сплайнах: 1. Видимо, наибольший интерес сплайны представляют в тео- теории приближений, а не при минимизации функционалов. Задан- Заданное отношение между данными очень удобно аппроксимировать с помощью сплайнов, а вот отыскать неизвестный сплайн путем минимизации куда менее удобно. 2. Если узлы расположены неравномерно, сплайны будут ненулевыми на четырех интервалах (это минимум для кубиче- кубического сплайна), и если каждый узел x2N-i приближается к x2n, В-сплайны превращаются в эрмитовы базисные функции \р и со. Аппроксимационные свойства всех этих пространств кусочно полиномиальных функций легко обобщить одной формулой. Если полиномы имеют степень k—1 (k — 3 для квадратичных элементов, ? = 4 для кубических), то гладкая функция и отли- отличается от своего интерполянта Ui на величину Порядок ошибки аппроксимации производных уменьшается на единицу при каждом дифференцировании: || и- и, I < Csh» - || и<« ||0. D4) Оценка D4) имеет смысл, если известно, что иг обладает s производными, Тч е. кусочно полиномиальная функция принад- принадлежит 36*. Поэтому s ^ q в неравенстве D4): q = 1 для непре- непрерывных квадратичных и кубических элементов, принадлежащих Жх, q = 2 для эрмитовых кубических элементов и ^=3 для сплайнов. При s > q оценку еще можно получать между узла- узлами, а в узлах появляются 6-функции. Эти результаты по аппроксимации приводят к ожидаемым скоростям сходимости метода конечных элементов при условии, что производная «W обладает конечной энергией: наклоны ап- аппроксимируются с ошибкой O(hh~l), энергия деформации с ошибкой O(ft2(ft-')) и перемещение и — uh с ошибкой O(hh). Так как при расчетах эти скорости подтверждаются, есть все осно- основания решать задачи с помощью хороших конечных элементов

80 I. ВВЕДЕНИЕ В ТЕОРИЮ Последний вопрос, рассматриваемый в этом разделе: реше- решение уравнения четвертого порядка Lu = (ru")"-(pu'Y + qu = f. D5) Оператор L формально самосопряжен, поскольку, и"' и и' здесь не встречаются, и положительно определен, если г ^ гтщ.> О, р 5г 0, q > 0. Энергетическое скалярное произведение, соответствующее задаче, равно а {и, v)=\ (ru"v" + pu'v' -f- quv) dx, а уравнением Эйлера для минимизации функционала I(v) = = a(v, v)—2(f,v) служит Lu = f. Для того чтобы применить метод Ритца, нужно взять пробные функции vh с конечной энер- энергией, а это означает, что vh s Ж2. Эрмитовы и сплайновые ку- кубические элементы здесь применимы, а просто непрерывные полиномиальные функции применять нельзя. Они здесь не под- подходят, и использовать их, игнорируя тот факт, что их вторые производные в узлах есть 6-функции, значит уже в одномерном случае нарваться на неприятность. Уравнение D5) описывает изгиб балки. Если она закреплена в точке х = 0, краевыми условиями будут и@) = и'@)«=0; это главные условия: каждая пробная функция должна иметь нуль второго порядка в начале координат. Чтобы выяснить, ка- каковы естественные условия при х — я, проинтегрируем по ча- частям уравнение а(и, v) = (f, v) и приравняем нулю первую ва- вариацию. В результате для каждой функции v из допустимого пространства Ж\ получим \ [(ги'Т ~ (риУ + qu-f]v + ru"v' [я + (ри' - (ги")') v |я=0. D6) Таким образом, если на v не налагаются условия в точке х = п, то естественными краевыми условиями на и будут усло- условия, соответствующие физически свободному концу: Еще один очень важный случай — балка имеет опору: ы(я) = 0. Это главное условие, которому должны удовлетворять пробные функции v. По этой причине последний член в первой вариации D6) автоматически равен нулю — без всякого условия на и в точке я. Однако другой проинтегрированный член равен нулю для всех v только твгда, когда ы"(я) = 0, и это естественное краевое условие остается. Таким образом, концу балки с опорой

1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ 81 соответствует комбинация главного и естественного краевых условий: и (л) = и" (я) = 0. Можно представить себе и другую комбинацию краевых усло- условий, например и'(п)= и" (л) = 0. Но их трудно понять как физически, так и вариационно. 1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ Здесь мы рассмотрим несколько задач на плоскости, или, вернее, в области Q на плоскости, ограниченной гладкой кри- кривой Г. Нашей целью в первую очередь будет сопоставление с дифференциальным видом этих задач, содержащих оператор Лапласа Д и бигармонический оператор А2, эквивалентной ва- вариационной формулировки. Это означает, что в вариационной постановке мы должны подобрать допустимые пространства, в которых ищется решение. Естественно, что эти пространства за- зависят от краевых условий, и, как и в случае одномерной краевой задачи, условия Дирихле (главные условия) будут отличаться от условий Неймана (естественных условий). Примеры привести очень легко, но они представляют собой простейшие модели плоского напряженного состояния и изгиба пластины, так что полезнее еще раз проиллюстрировать основные идеи: 1) Эквивалентность дифференциальной и вариационной за- задач, допустимое пространство, в дальнейшем пополняемое в энергетической норме. 2) Равенство нулю первой вариации, дающее уравнение в слабой форме а(и, v) — (f, v) и приводящее к методу Галёркина. 3) Процесс минимизации Ритца на подпространстве. В следующем разделе подробно излагается метод конечных элементов, рассматриваются многие из наиболее важных спосо- способов выбора кусочно полиномиальных «элементов». Требование гладкости граничной кривой Г создает одну трудность, но избавляет от других. С одной стороны, ясно, что внутренность Q нельзя разбить на многоугольники, скажем на треугольники, без потери точности около границы. Эта труд- трудность в рамках теории аппроксимации обсуждается в гл. -3. С другой стороны, гладкость границы позволяет предположить гладкость самого решения. Это свойство следует из теории эл- эллиптических краевых задач, если коэффициенты уравнения и правая часть также гладкие. Рассмотрим для сравнения задачу ихх -f- иуу = 1 на много- многоугольнике с условием и = 0 на границе. Для единичного квад- квадрата решение ведет себя, как г2 log r вблизи угла, а вторые про-

82 1. ВВЕДЕНИЕ В ТЕОРИЮ изводные рвутся. (Разрывность очевидна, поскольку в угловой точке ихх и иуу равны нулю', а их сумма — единице.) Здесь и имеет вторые производные в среднем квадратичном; и принад- принадлежит Ж2, но не Ж%. Это можно проверить непосредственно, разлагая и в ряд Фурье. Поэтому к задаче применима оценка ошибки кусочно линейной аппроксимации, но точность, связан- связанную с элементами более высокого порядка, нельзя увеличить без специального построения сетки в углах или без введения специальной пробной функции с той же особенностью, что и у решения и. Для невыпуклого многоугольника, например для L-образной области, решение и не обладает вторыми производ- производными даже в среднем квадратичном. Решение должно принад- принадлежать пространству Жх% представляющему собой допустимое пространство (вернее, Жх содержит допустимое пространство, зависящее от краевых условий), и так как и вблизи тупого угла L-образной области ведет себя как г*>\ то и не принадлежит Ж2. Особенности решения, возникающие из-за нарушения гладкости Г, изучаются в гл. 8. Начнем с задачи Дирихле для уравнения Пуассона — Ли = f в Q, краевое условие — типа Дирихле: и —О на Г. Знак «минус» в дифференциальном уравнении выбран потому, что для оператора дх2 ду2 соответствующая квадратичная форма (Lu, и) положительна. Как и в одномерном случае, нужно сначала ввести норму для неоднородного члена, т. е. выбрать множество правых ча- частей /, для которых задача Дирихле решается. Вы&ерем норму, как прежде: llflb = f !/(*, y)\2dxdy ¦г Если она конечна, то / принадлежит пространству Ж°(п). Как и в одномерном случае, это пространство содержит все кусочно непрерывные функции / и не содержит б-функций. В качестве возможных решений дифференциального уравне- уравнения исследуем все функции и, равные нулю на границе Г и имеющие в Q производные до второго порядка включительно.

1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ 83 Естественной нормой для такого пространства решений будет I «112 = [\\ (« 2 + и\ + "I + «L + *%, + и„ Пространством функций, для которых эта норма конечна (т. е. функций, вторые производные которых обладают конечной энер- энергией), будет Ж2(&). Пространство решений задачи Дирихле Эё% — подпространство в Ж2, определяемое краевым условием и — 0 на Г. Из определения норм ясно, что оператор Лапласа L = —Д является ограниченным оператором из Зёв в Ж : В теории Дирихле решающую роль играет обратное в некото- некотором смысле утверждение: оператор, обратный к L, задаваемый функцией Грина задачи, дает решение и, непрерывно зависящее от правой части f. Это означает, что для каждой функции f су- существует единственное решение и и для некоторой постоянной р Ци||2<р11Л1о- D7) Это решение можно построить непосредственно методом конеч- конечных разностей; чаще всего используют пятиточечное разностное уравнение Около границы это уравнение надо изменить, но здесь удается сохранить и второй порядок точности схемы, и дискретный прин- принцип максимума, очевидный из D8): если f = 0, то Uitj не может превышать ни одного из четырех значений Ui±ii j±i. (Мы не знаем, существует ли теоретический предел порядка точности схем, удовлетворяющих принципу максимума. Ясно одно: если точность возрастает, то краевые условия для разностного урав- уравнения становятся чрезвычайно сложными.) Не входя "в детали, отметим, что уравнение, конечно, требует непрерывности f, чтобы были корректно определены значения fui = f(iAx,jAy). Если же функция f недостаточно гладка, мож- можно применить некоторый осредняющий процесс (который опять будет исходить из вариационных методов!). Наилучшая оценка для пятиточечной схемы на квадрате дает max | и,,; — Ut,, | < Ch21 In h \ max | f \. Здесь h = Ах = Ау. Дополнительный множитель |1п/г|, ненуж- ненужный в одномерном случае, здесь необходим из-за характера поведения г2 In r в угле.

84 1. ВВЕДЕНИЕ В ТЕОРИЮ Для нас важна формулировка задачи Дирихле в вариацион- вариационной форме: среди всех допустимых функций v, равных нулю на границе Г, только решение и минимизирует квадратичный функ- функционал Сначала нужно показать, что решение и дифференциальной задачи действительно минимизирует /. Изменяя и в направле- направлении v, получаем / (и + to) = I (и) + 2е 5 J (uxvx + uyvy - f v) + e2 \ \ (v\ + vy). Достаточно убедиться, что коэффициент при е равен нулю. Тог- Тогда, так как коэффициент при s2 положителен, если v Ф const (если v = const, то v = 0 из краевых условий), и будет един- единственной функцией, минимизирующей /. Равенство нулю коэф- коэффициента при е, или первой вариации, означает, что D9) для всех допустимых v. Докажем с помощью теоремы Грина, что решение задачи Дирихле удовлетворяет D9). Проинтегри- Проинтегрируем по частям в области Q: \nvds'=0. E0) Здесь ип — производная от и в направлении внешней нормали. Так как v = 0 на Г, а и удовлетворяет уравнению Пуассона в Q, то первая вариация равна нулю. Следовательно, и — миними- минимизирующая функция. . Конечно, все это можно сделать и в обратном направлении. Уравнение Пуассона —Аи = f приводится к своей слабой форме умножением на функцию v, равную нулю на границе, а затем интегрируется по Й с преобразованием левой части по формуле Грина. Слабая форма дает в точности уравнение D9). К нему применим метод Галёркина; это уравнение удовлетворяется в подпространстве Sh и решение uh ищется тоже в Sh. Как легко видеть, если квадратичная форма а (и, и) самосопряжена и по- положительно определена, минимизация Ритца и метод Галёркина приравнивания нулю первой вариации эквивалентны. Уравнение в слабой форме а(и, и) = (f,v) сохраняет смысл и без требова- требования самосопряженности. Все эти рассуждения основаны на теории эллиптических уравнений. Предположим теперь, что все начинается с квадра- квадратичного функционала I(v), и попытаемся непосредственно мини-

1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ 85 мизировать его. Первая проблема — выяснить точно класс функ- функций и, допустимых в процессе минимизации. Соображения здесь очень похожи на одномерный случай разд. 1.5. Всякая гладкая функция v, равная нулю на Г, допу- допустима, так как, если f = —kv, функция v будет той самой мини- минимизирующей функцией, которую мы хотим получить. С другой стороны, требование гладкости v, например v.^ Ж%, не обяза- обязательно для определения I(v). Поэтому пополняем допустимое пространство: если a(v—vN, -v—у^)->0для некоторой после- последовательности {vN} из Ж%, то функция v также будет допустима. Процесс пополнения приводит к классу функций, который ин- интуитивно представляется естественным: функция v должна рав- равняться нулю на Г (условие Дирихле — главное), но она обла- обладает только первыми производными в среднем квадратичном. Другими словами, квадратичный член a(v,v) в функционале I(v) должен иметь смысл, OO. E1) Функции, удовлетворяющие E1), принадлежат !№l(Q). Подпро-. странство функций, удовлетворяющих к тому же условию Ди- Дирихле v = 0 на Г, обозначается 5$o(Q). (В наших обозначениях это было Зб\, но в специальном случае задачи Дирихле будем употреблять Ж\; в литературе также встречается обозначение Ж1.) Это и есть пространство допустимых функций для задачи Дирихле. . . Важно подчеркнуть, что краевое условие v — 0 сохраняется для всего допустимого пространства, но не потому, что нам так хочется, а потому, что оно настолько сильное, что справедливо в пределе. Другими словами, условие Дирихле v = 0 на Г устойчиво в ^'-норме: если последовательность функций vN, равных нулю на границе, сходится в естественной энергетиче- энергетической норме к v, то предел v также равен нулю на границе. Такой устойчивости краевого условия нет для уравнения — Au + qu = f в Q E2) с естественным краевым условием ип = 0 на Г. Функционал для этой задачи Неймана равен /(о) = а(о, v)-2(f, V)= Для дифференциального уравнения решение и ищется в Ж%, т. е. -оно обладает двумя производными и удовлетворяет уело-

86 1- ВВЕДЕНИЕ В ТЕОРИЮ вию Неймана ы„ = 0. Однако каждая функция v из Жх есть предел последовательности функций из Ж%: пространство Ж% плотно в Жх. Поэтому после пополнения допустимым простран- пространством для вариационной задачи Неймана будет все простран- пространство ЖХ{Щ. В результате на пробные функции vh в методе Рит- ца не налагается никаких краевых условий, приемлемо любое подпространство Shcz3^1. При практическом применении ме- метода конечных элементов это означает, что значения vh в гра- граничных точках не подчинены никаким ограничениям — это не- несколько упрощает дело по сравнению с задачей Дирихле. (В дей- действительности естественные краевые условия приводят к возра- возрастанию численной неустойчивости, а это заставляет нас сомне- сомневаться в преимуществах задач типа задачи Неймана.) Конечно, минимизирующая функция и (но не ее приближе- приближение uh) должна автоматически удовлетворять условию Неймана, если она достаточно гладкая. Это подтверждается уравнением E0) для первой вариации, равной нулю для всех v из допусти- допустимого пространства Жх (Q). Прежде всего функция w = uxx-\- + Щу + / должна равняться нулю всюду в Q, и функцию v можно взять равной w в некоторой малой окрестности Г и нулю в остальных точках. Это дает \\до2 = 0. Так как до = 0, ясно, что ип = 0 на границе. Поэтому условие Неймана справедливо для ы, даже если оно не выполняется для всех допустимых v. Если в E2) q = 0, то очевидно, что решение и не един- единственно: и + с будет решением для любой постоянной с. Такая свобода выбора решения, если учесть альтернативу Фредгольма, наводит на мысль, что должно быть ограничение на правую часть /. После интегрирования обеих частей дифференциального уравнения —Аи = / по Q левая часть -равна нулю по формуле Грина E0) с v = \. Поэтому ограничение на / таково: задача Неймана с q = 0 не может иметь решения при \ \ f dx dy Ф 0. Факт отсутствия решения непосредственно проверяется на одно- одномерной задаче Неймана и" = 2, и'@) = и'A) = 0. Парабола и = х2 + Ах + В, т. е. общее решение уравнения ы" = 2, не может удовлетворять краевым условиям. Соответ- Соответственно = 0=^ $ 2. Напротив, решение задачи Дирихле в этом случае единственно. Различие между условиями Дирихле и Неймана должно про- проявляться также в тео'рии, когда проверяется эквивалентность

1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ 87 энергетической нормы л/а(и, v) и обычной нормы IMIi в допу- допустимом пространстве. Проблема существования и единственно- единственности упирается в вопрос: является ли задача эллиптической, т. е. существует ли такая постоянная а > 0, что a(v, o)>al|o||J E3) для всех допустимых и? Для уравнения —Au + <7u = f это то же самое, что S \ 0 При # > 0 эллиптичность очевидна, так что существует един- единственная минимизирующая функция и (или uh в методе Ритца). При q = 0 для задачи Неймана эллиптичности нет: если v = 1, левая часть равна нулю, а правая нет. В задаче Дирихле жест- жесткое перемещение тела v = 1 недопустимо, и выполняется лера- венство типа Пуанкаре: для 0. Таким образом, задача Дирихле — эллиптическая даже при q = 0. Действительно, эллиптичность просто означает, что q превышает наибольшее собственное значение Яшах оператора Лапласа А. В задаче Неймана Яшах = 0, v= 1 — соответствую- соответствующая собственная функция и при q = 0 эллиптичность отсут- отсутствует. В задаче Дирихле Яшах < 0, и она остается эллиптиче- эллиптической даже для некоторых отрицательных значений q. Конечно, можно потребовать, чтобы и = 0 только на части границы, скажем на Гь и положить ип = 0 на Г2 = Г — Гь До- Допустимое пространство для такой смешанной задачи состоит из функций v^3$x, равных нулю на Гь и решение будет иметь особенность на стыке Ti и Г2. Другая возможность выбора краевого условия — равенство нулю на границе косой производной: ип+с(х, y)us = 0 на Г, где us — производная по касательной. Это естественное крае- краевое условие, связанное со скалярным произведением а (и, v) = jj ^ (uxvx + UyVy + cuxvy — cuyvx + cyuxv — cxuyv). Это скалярное произведение дает уравнение Пуассона как ин- интеграл от uxvx-\- UyVy. Действительно, тождество Грина преоб- преобразует равенство а(и, v) = (f, v) в равенство

88 1- ВВЕДЕНИЕ В ТЕОРИЮ Изложенное хорошо иллюстрирует тот факт, что не существует единого способа интегрирования (Lv,v) no частям для получе- получения энергетической нормы a(v,v). Различные действия над (Lv,v) приводят к различным формам a(v,v) и соответственно к различным естественным краевым условиям. Мы увидим это еще раз чуть позже в примере, где коэффициент Пуассона вхо- входит в краевые условия и в энергетическую норму a(v,v), но не в оператор L = А2. Неоднородные краевые условия для уравнения —Аи = / бы- бывают двух типов: либо закрепление на границе u = g(x, У) на Г, либо задание нагрузок на границе, что можно включить в ус- условие Ньютона общего типа un + d(x, y)u = b (х, у) на Г. С вариационной точки зрения эти условия совершенно раз- различны. Первое представляет собой неоднородное условие Ди- Дирихле, и ему должны удовлетворять пробные функции; решение и минимизирует \\у2+и2—2fy на классе функций сеЖ1, удовлетворяющих'условию v = g на границе. Заметим, что до- допустимый класс ЖХЕ здесь не будет пространством: сумма двух допустимых функций равна 1g на границе, так что не будет до- допустимой. Однако разность двух допустимых функций равна нулю на границе и принадлежит пространству Ж- Простейшее описание допустимого класса Ж\ таково: возьмем в нем какую- нибудь функцию, скажем G(x,у), совпадающую с g на границе; тогда каждая допустимая функция v представима в виде G + v0, где v0 принадлежит Ж\. Короче . <3т?в = G -f" 5i?0" В методе Ритца не требуется, чтобы пробные функции в точно- точности совпадали с g на границе. Достаточно, чтобы пробные функции имели вид vh = Gh (х, у) + ? <7/Ф/ (х, У), гДе Ф^ е ^о» a Gh принимает на Г значения, близкие к g. Это означает, что' класс пробных функций есть где So — подпространство в Эв\. В разд. 4.4 проверяется, что в этом случае применима основная теорема 1.1 метода Ритца (можно даже отказаться от предположения, что So cz Ж\, но это уже выходит за рамки теории Ритца},

1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ 89 Нако.нец, рассмотрим краевое условие un-\-du = b. Это ус- условие будет естественным, если основной функционал \ \ v2x + + v2 — 2fv изменить, вводя функции dub. Изменения касаются только граничных членов: I(v)=\j\ivl+v2y-2fv+ \(dv2~2bv)ds. Q Г Подчеркнем, что первый новый член входит в энергию a(v, v) и вносит, таким образом, вклад в матрицу жесткости К метода Ритца. Новый линейный член —2bv вносит вклад в граничные компоненты вектора нагрузок F. Допустимым пространством будет все пространство Жх, и потому любую непрерывную, между элементами кусочно полиномиальную функцию можно использовать как пробную. Мы хотим исследовать три задачи четвертого порядка, от- относящиеся к бигармоническому уравнению А2" = ихххх + 2иххуу -f uyyyy = f в Q. E4) Это уравнение описывает поперечное перемещение и, тонкой пластины под действием силы f{x,y) с нормализованным коэф- коэффициентом жесткости D= 1. Как обычно, число m краевых ус- условий равно половине порядка уравнения, т. е. т= 2. Первая возможность — условия Дирихле, означающие фи- физически закрепленную пластину: и = 0, «„ = 0 на Г. Большой интерес представляет также задача о свободно опер- опертой пластине, в которой одно краевое условие главное, а другое естественное. Как и в задаче для уравнения Пуассона с косой производной, вид естественного краевого условия будет зави- зависеть от вида вариационного интеграла I(v). В теории упругости естественное краевое условие включает коэффициент Пуассона v, определяющий изменение ширины при растяжении мате- материала в длину; обычно выбирают v = 0,3. Краевые условия, определяемые физическими соображениями, таковы: (l -\)unn = 0 на Г. E5) Сюда входят, конечно, случаи v = 0 и v = 1, которые могут возникнуть в других приложениях. Заметим, что на прямоли- прямолинейной границе все производные по касательной равны нулю, Ды = ы„п, и v исчезает из краевого условия. В разд. 4.4 пока- показано, к каким замечательным и парадоксальным следствиям

90 1- ВВЕДЕНИЕ В ТЕОРИЮ приводит это исчезновение при аппроксимации окружности многоугольником. Наконец, исследуем чистую задачу Неймана, соответствую- соответствующую свободной границе. Второе краевое условие E5) сохра- сохраняется; его часто записывают в виде м — -?*¦ = «ид + v (<рл, + и„) = 0, где ф — угол между нормалью и осью х. Условие и = О, фикси- фиксирующее край, отбрасывается. Чтобы почувствовать, зачем это условие нужно, попробуйте вычислить коэффициент при 6м, когда меняется энергетический функционал в E6). Этот коэффи- коэффициент найден Ландау и Лифшицем в терминах и и ш: он обычно записывается в сжатой форме Кирхгофа Qn + oMns/ds = 0. В практических задачах вся граница редко бывает свободной. Все приведенные условия, разумеется, можно переписать, непосредственно заменяя производные конечными разностями, однако построить хорошие уравнения вблизи границы стано- становится необычайно трудно, и лучше уж сразу начинать с вариа- вариационной формулировки задачи. С вариационной точки зрения, задача состоит в минимиза- минимизации функционала I(v) = a(v,v)-2(f,v) = xxvyy + 2(l-v)vly-2fv)dxdy E6) при соответствующих краевых условиях. В задаче Неймана не налагается ограничений на границе и пространство допусти- допустимых функций v есть в точности Ж2(п). В задаче Дирихле тре- требуется v = 0 и vn = 0; подпространство, удовлетворяющее этим ограничениям, есть Ж\(п). В промежуточном случае свободно опертой пластины главным является только условие v = 0; обозначим соответствующее подпространство через 2e2ss и заме- заметим, что loC^lscf2. Теорема Грина дает эквивалент- эквивалентность этих вариационных и дифференциальных задач. Подчеркнем, что четвертые производные, появляющиеся в члене Д2м в теореме Грина, не требуются для справедливости теоремы о минимуме потенциальной энергии в вариационной формулировке. Обратное тоже верно. Предел функций, имею- имеющих непрерывные четвертые производные и стремящихся к ре- решению, может оказаться функцией другого типа, а идея попол- пополнения состоит в получении допустимого (условиями минимума) пространства функций, удовлетворяющих лишь главным крае-

1.8. ДВУМЕРНЫЕ КРАЕВЫЕ ЗАДАЧИ 91 вым условиям и обладающих конечной энергией a(v,v). Реше- Решение и тогда удовлетворяет уравнению в слабой форме a(u,v) = Для теории метода Ритца ключевой момент — эквивалент- эквивалентность энергетической нормы -\/a (v, v) обычной норме || v ||2. Это опять условие эллиптичности: существует такая постоянная а > 0, что для всех допустимых v c(v, v)^a\\-v\\l, или При полностью свободной границе эллиптичность нарушается, так как решение единственно только с точностью до линейной функции а + Ьх + су. Если дифференциальную задачу заме- заменить задачей А2и-\- qu = f, соответствующей пластине с по- постоянным вращением q = рю2 > 0, она снова станет эллипти- эллиптической. Эллиптичность трудно доказать, если —• как в задаче линей- линейной упругости — неизвестных Uj два или три и энергия дефор- деформации содержит только определенные комбинации ец = («,, ji + + «j, г)/2 их производных. Существует, правда, неравенство Корна, утверждающее, что энергия деформации превосходит <ЗГ-норму, т. е. Yj \e4!e4!>°Yj §"'•/"<•/• Прежде чем строить конечные элементы для решения таких задач, обсудим кратко функциональные пространства 2es(Q). В одномерном случае они описываются очень просто: функция v принадлежит Жв[0,\], если она является первообразной по- порядка s от f, \ f2dy < оо. Отсюда следует, что функция у и ее первые s — 1 производных непрерывны; только s-я производная, т. е. исходная функция f, быть может, имеет скачки или что-ни- что-нибудь похуже. На плоскости возможна ситуация, когда функция v разрыв на и в то же время дифференцируема. Такова, например, функ ция v = log log \/r е Ж1 в круге г ^ 1/2: \\ (log r)~2d(log r) dQ = - log 2 ' Таким образом, производные от функции v, как и она сама, обладают конечной энергией, но функция разрывна в начале

92 I. ВВЕДЕНИЕ В ТЕОРИЮ координат. В л-мерном пространстве действует общее правило: если v e Ж* и s~> п/2, то функция v непрерывна и тах| о (*,,...,*„) |<С ||о||,. E7) В этом смысл замечательного неравенства Соболева, связываю- связывающего два свойства: непрерывность и коне.чность энергии произ- производных. Если v e^s hs^ /1/2, то гарантировать непрерывность v нельзя. По соображениям двойственности с помощью теоремы Собо- Соболева можно выяснить, когда «-мерная б-функция принадлежит Ж~$. Конечно, это возможно, только если —s < 0; лишь после достаточного количества интегрирований б-функция может об- обладать конечной энергией. Норма в Ж~$ определяется анало- аналогично A2): \ wv dxt ... dxn Если w есть б-функция, скажем в начале координат, то Согласно неравенству Соболева E7), эта величина конечна и б-функция принадлежит Ж~* тогда и только тогда, когда s > п/2. В частности, б-функция на плоскости не принадлежит Ж~1 и соответственно фундаментальное решение уравнения Лапласа l не принадлежит Ш~х: \\ к+ui=И [«г2+GrJ]rdrdQ=SS r~i drм=°°- ¦ Поэтому точечно нагруженная мембрана, строго говоря, недо- недопустима в вариационной задаче. Для пластины ситуация другая, так как дифференциальное уравнение имее,т четвертый порядок. Пространством решений будет Ж2 (с краевыми условиями), а у пространства правых частей гладкость на 4 ниже, т. е. Ж~2. На плоскости б-функция принадлежит Ж~2, и возможна ситуация точечно нагруженной пластины. Еще один вопрос относительно функциональных пространств Ж8, очень важный для конечных элементов: при каком условии элемент является согласованным"? Другими словами, если за- задано дифференциальное уравнение порядка 2пг в пространстве п независимых переменных, то какие кусочно полиномиальные функции принадлежат допустимому пространству Же^ Очень

1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 93 легко проверить выполнение главных краевых условий; един- единственный вопрос — насколько гладким должен быть элемент для того, чтобы он принадлежал Яёт? Стандартное условие согласованности хорошо известно: пробная функция и ее первые т—1 производных должны не- непрерывно продолжаться за границы элемента. Это условие, оче- очевидно, достаточно для допустимости, так как т-е производные могут в худшем случае иметь скачок между элементами, а их энергия конечна. С другой стороны, пример log log A/г) пока- показывает, что вряд ли это необходимое условие согласованности; существуют функции, не обладающие т— 1 непрерывными про- производными, но принадлежащие Жт и являющиеся допустимыми. К счастью, такие «нехорошие» функции не могут быть кусочно полиномиальными. Если v — полином . (или отношение полино- полиномов) на каждой стороне границы элемента, то v принадлежит Жт тогда и только тогда, когда производные порядка, мень- меньшего пг, непрерывно продолжены за границу элемента. Залог успеха метода конечных элементов состоит в построении таких элементов, чтобы обеспечить удобный базис и одновременно высокую степень- аппроксимации. 1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ В этом разделе описываются наиболее важные конечные эле- элементы на плоскости. История их построения насчитывает при- примерно 30 лет, если вспомнить раннюю работу Куранта о ку- кусочно линейных элементах; это одна из излюбленных тем в при- прикладной математике. Она требует знания алгебры лишь в рамках средней школы, а результаты ее очень важны — редкая и счастливая комбинация. Цель состоит в выборе кусочно поли- полиномиальных функций, определяемых небольшим и удобным на- набором узловых значений, и достижении нужной степени непре- непрерывности и аппроксимации. Существует много элементов, конкурирующих между собой, и пока не ясно, что эффективнее — разбить область на треуголь- треугольники или на четырехугольники. Очевидно, что треугольники лучше при аппроксимации криволинейной границы, а' четырех- четырехугольники (особенно прямоугольники) имеют преимущество внутри области: их меньше и они позволяют строить простые элементы высших степеней. Уже эти замечания наводят на мысль, что лучше всего использовать обе возможности при условии, что их можно объединить с помощью узловых точек, обеспечив при этом требуемую непрерывность при стыковке. Начнем с разбиения исходной области Q на треугольники (рис. 1.10). Объединение этих треугольников даст многоуголь- многоугольник Qh, и, вообще говоря, если граница Г криволинейна, при-

94 1- ВВЕДЕНИЕ В ТЕОРИЮ граничное множество Q — Qh будет непустым. Длину наиболь- наибольшей стороны /-го треугольника обозначим через hj, h = max hj. Ради удобства предположим, что Qh — подмножество в Q и ни одна вершина треугольника не лежит на стороне другого тре- треугольника. На практике, поскольку положение каждой вершины Zj = (xj, У)) должно быть известно ЭВМ, триангуляция прово- проводится так, как это допускают возможности ЭВМ. Полностью автоматизированная подпрограмма триангуля- триангуляции начинается с покрытия Q регулярной треугольной сеткой, а затем вносятся необходимые исправления вблизи границы. Рис. 1.10. Разбиение многоугольника Q на нерегулярные треугольники. Если сетка оказывается слишком грубой в одной части области Q и более мелкой в другой или область имеет углы и другие особенности, триангуляцию нужно производить вручную. В не- некоторых случаях, как показал Джордж [Д6], сгущение грубой сетки достигается разбиением каждого треугольника на четыре подобных; для такой механической процедуры идеально подхо- подходит ЭВМ. Пользователь может начать с введения в ЭВМ грубой сетки с минимальными затратами времени и усилий, а затем уже работать с полученной хорошей сеткой. Более того, он мо- может использовать в своей программе один небольшой прием, который рекомендуем всем: проверять, приводит ли изменение в /г к приемлемому изменению в численном решении. Опишем простейший и самый важный способ построения пробной функции, если задана триангуляция. Такая функция линейна внутри каждого треугольника (vh = а{ -\- а2л: + <*зу) и непрерывно продолжается за его стороны. График vh(x,y) пред- представляет собой поверхность, состоящую из треугольных кусков,

1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ бб стыкующихся вдоль сторон. Это очевидное обобщение кусочно линейной функции в одномерном случае. Подпространство Sh, составленное из таких кусочно линейных функций, предложено Курантом [К15] для решения вариационных задач. Оно образует подпространство в Ж\ так как первые производные кусочно постоянны. Такие функции в самом начале развития метода конечных элементов были независимо исследованы Тернером и другими авторами; они иногда называются треугольниками Тернера. Непрерывность позволяет избавиться от б-функций в пер- первых производных на границах между элементами; без этого ограничения функции не будут допустимыми и их (бесконеч- (бесконечную) энергию на Q нельзя получить суммированием по внутрен- внутренностям всех элементов. Простота пространства Куранта связана с тем, что внутри каждого треугольника три коэффициента функции vh = й\ + + а2х + 0-ъУ однозначно определяются значениями vh в трех вер- вершинах. Это Означает, что функцию можно удобно описать, зада- задавая узловые значения, или, что то же самое, Sh имеет удобный базис. Более того, vh вдоль каждой стороны оказывается линей- линейной функцией одной переменной и эта функция очевидным обра- образом определяется значениями на концах стороны. Значение vh в третьей вершине не влияет на функцию вдоль этой стороны независимо от того, где расположена эта третья вершина. По- Поэтому непрерывность vh на стороне гарантируется непрерывно- непрерывностью в вершинах. В случае главного краевого условия, скажем и = 0 на Г, простейшее подпространство Sh cz Ж\ образовано функциями, от которых требуется равенство нулю на границе многоуголь- многоугольника Th. Расширенные нулем в полосе Q — Qh, эти функции vh непрерывны во всей области Q, принадлежат пространству Ш\ и допустимы для задачи Дирихле. Размерность N пространства Sh, т. е. число свободных пара- параметров в функциях vh, совпадает с числом незакрепленных узлов. (Граничный узел, в котором требуется равенство vh нулю или другому заданнрму перемещению, называется закреплен- закрепленным; он не влияет на размерность подпространства.) Для дока- доказательства обозначим через q>j(x, у) пробную функцию, равную 1 в /-м узле и нулю в остальных. Такие пирамидальные функ- функции (pj образуют базис в пространстве пробных функций Sh. Произвольную функцию vh e Sh можно представить единствен- единственным образом в виде линейной комбинации N vh (х, у) = X «до, (*, у).

96 1- ВВЕДЕНИЕ В ТЕОРИЮ В таком виде координата qj имеет естественный физический смысл: перемещение vh в /-м узле z$ = (Xj,t/j). Это характерная черта элементов, построенных для инженерных расчетов: каж- каждая координата qj соответствует значению функции vh или од- одной из ее производных в узловой точке области. Оптимальные координаты Qj определяются из условия мини- минимизации функционала / (ул) =/(? <7/фД квадратичного по переменным qu ..., qN. Подчеркнем, что минимизирующая функция uh = X Q/Ф/ не зависит от выбора базиса. Базис вы- выбирался только для того, чтобы привести задачу к виду KQ = F, удобному для вычислений. С другой стороны, выбор базиса очень влияет на вычисление решения. Матрица жесткости К', полученная при выборе другого базиса, подобна матрице К; К' = SKST, где S — некоторая матрица, F заменяется на F' = SF. Вопрос сводится к выбору такого базиса, чтобы мат- матрица К была разреженной и хорошо обусловленной и при этом элементы матриц К и F по возможности упрощали вычисление. Выбор конечных элементов ф3-, основанный на интерполиро- интерполировании узловых значений, весьма эффективен. Матрица К в ра- разумных пределах хорошо обусловлена и разрежена, так как два узла связаны только" тогда, когда они принадлежат одному и тому же элементу. Более того, скалярные произведения Кц = = а(ф,-, фз) и Fj=(f,q>j) находятся очень быстро по стандарт- стандартному алгоритму, причем можно не вычислять по очереди сами скалярные произведения, а лишь вклады в них по всем тре- треугольникам. Это означает, что интегралы вычисляются на каж- каждом треугольнике, в результате образуются матрицы жесткости элементов &*. Каждая матрица k{ включает только, узлы i-ro треугольника, остальные ее элементы равны нулю. Затем из этих блоков kt строится глобальная матрица жесткости К, со- содержащая все скалярные произведения. В разд. 1.5 этот про- процесс был описан на интервале, а в следующем разделе-мы дадим его обобщение на треугольную сетку. Треугольники Куранта приводят к очень интересной матрице жесткости К- Для уравнения Лапласа получается стандартная пятиточечная разностная схема, если треугольники строятся ре- регулярным образом, т. е. разбиением квадратной сетки диаго- диагоналями в северо-восточном направлении. (Более точную девяти- девятиточечную схему можно аналогично получить с помощью били- билинейных элементов [Ф9], но это редко .^лают.) Такая простая и систематическая структура матрицы. Лесткости позволяет ис- использовать для решения уравнения kQ = F быстрое преобра- преобразование Фурье. Оно дает отличный результат на прямоуголь- прямоугольнике; его применение на непрямоугольных областях успешно развивается в' работах Дорра, Голуба и др. С математической

1.9, ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 9? точки зрения основное свойство пятиточечной схемы заключает- заключается в принципе максимума: все внедиагональные элементы Кц в матрице жесткости отрицательны, диагональные элементы Ки доминируют над ними, так что обратная матрица К~1 неотрица- неотрицательна. Простой подсчет показывает, что это справедливо для линейных элементов на любой триангуляции, в которой нет углов, превышающих я/2. (Точное условие таково: сумма двух углов, прилежащих к данной стороне, не превышает я.) То же верно и для п-мерных линейных элементов. Так как /С~' и все Фз(лг) неотрицательны, то для аппроксимации ик по методу ко- конечных элементов выполняется тот же физический закон, что и для точного перемещения и: если нагрузка f всюду положи- положительна, то таково же и перемещение. Фрид задает вопрос: спра- справедливо ли это для элементов высших степеней? Среди внедиа- гональных элементов Кц могут быть положительные, но ведь условие их отрицательности не является необходимым для по- положительности матрицы К. В задаче Неймана не налагается никаких ограничений на vh в граничных узлах и размерность пространства Sh равна . общему количеству внутренних и граничных узлрв. Базисные функции qjj опять равны 1 в одном узле и 0 в остальных. В этом Елучае, однако, нельзя доопределять пробные функции нулем в Q — Qh, так как они станут разрывными. Вместо этого можно просто продолжить линейно в каждую часть полосы Q — Qh функцию из прилегающего треугольника. Есть и другие возможности, мы упомянем об одной: можно игнорировать приграничную полосу и изучать задачу Неймана только внутри многоугольной области Qh. Конечно, приближен* ное решение может значительно измениться и точность умень- уменьшится по сравнению с минимизацией интеграла на Q. Такие ошибки, связанные с изменением краевой задачи, оцениваются в гл. 4. Займемся теперь более точными элементами. В технике ко- немных элементов решающим шагом было обобщение основной «айн Куранха о простых пробных функциях. Вместо линейности функции vh внутри каждого треугольника будем предполагать ее квадратичность: vh = а, + а** + а3у + atx2 + а5ху + а6г/2. E9) Для того чтобы.функция vh принадлежала Ж1, она должна быть непрерывна при переходе через сторону в соседний треугольник. Для удобства работм с таким подпространством нужно по- построить его базис, т. е. такое множество непрерывных кусочно квадратичных функций ф,-* ,что любой элемент из Sh единствен- единственным образом представляется ^ ,виде vh {х, У) =» ? <7/Ф/ (*, У)* 4 Зак. 287

68 1. ВВЕДЕНИЕ В ТЕОРИЮ Для построения базиса существует прекрасная конструкция. До- Добавим к вершинам треугольников узлы, помещая их в середины сторон треугольников (рис. 1.11,а). Каждому узлу, будь он вершиной или серединой стороны, поставим в соответствие функцию q>j, равную 1 в этом узле и 0 в остальных. Функция <р задается в каждом треугольнике в шести точках — в трех вер- вершинах и в трех серединах сторон, поэтому 6 коэффициентов а* в формуле E9) определяются однозначно. Рис. 1.11. Расположение узлов для квадратичных и кубических элементов: а — непре- непрерывные квадратичные элементы, б — непрерывные кубические элементы, в — кубические элементы из пространства Z^. Докажем непрерывность построенных кусочно квадратичных Элементов на сторонах треугольников. Доказательство очень простое. Вдоль каждой стороны vh будет полиномом второй степени от одной переменной. На каждой стороне лежат 3 узла — две вершины и средняя точка. Полином второй степени тремя значениями в -узлах определяется однозначно. Для двух соседних треугольников эти значения одинаковы, а значения в остальных узлах не влияют на vh вдоль стороны, так что непрерывность доказана. Для стороны, лежащей на внешней границе ГЛ в задаче Дирихле, три узловые значения (а значит, и весь полином) равны нулю. Каждая функция vh из Sh допускает единственное разложе- разложение вида X <7/Ф/> гДе коэффициент q$ есть значение vh в /-м

f.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 99 внутреннем узле (в середине стороны или в вершине)._ Поэтому qpj образуют базис в пространстве Sh, размерность которого, таким образом, равна числу N незакрепленных узлов. Для непрерывных кусочно кубических элементов базис строится точно так же. Кубический полином двух переменных х и у определяется десятью коэффициентами^, в частности, зна- значениями в десяти узлах (рис. 1.11,5). Опять-таки 4 узловых значения на каждой из сторон определяют однозначно кубиче- кубический полином, заданный на этой стороне, и непрерывность обес- обеспечена. Это треугольный аналог одномерных кубических эле- элементов, построенных в разд. 1.6 (тех, которые только непрерыв- непрерывны и имеют 2 узла внутри каждого интервала). Та же самая конструкция распространяется на полиномы степени k—1 нескольких переменных х\, ..., хп при условии, что основные области разбиения — симплексы: интервалы при я= 1, треугольники при п = 2, тетраэдры при л—3. Можно получить дискретные аналоги произвольно высокой степени точ- точности в n-мерном пространстве. К сожалению, с точки зрения практических приложений существует фатальное обстоятель- обстоятельство: размерность пространства Sh, равная общему числу внут- внутренних узлов, растет чрезвычайно быстро при росте k и п. Глав- Главная проблема в методе конечных элементов — наложить допол- дополнительные ограничения на пробные функции (тем самым умень- уменьшая размерность пространства Sh) без нарушения свойств аппроксимации и простоты локального базиса. Это можно сделать, увеличивая требования на гладкость. В случае кубической аппроксимации можно добавить условие непрерывности первых производных функции vh в каждой вер- вершине. Очевидно, что получится подпространство пространства просто непрерывных кубических элементов vh. Если m треуголь- треугольников имеют общую вершину внутри области, непрерывность vx и vy налагает новые ограничения на пробные функции и размерность N соответственно уменьшается. Чтобы построить базис, уберем средние точки на сторонах и образуем в вершинах «тройной узел». Другими словами, 10 коэффициентов кубиче- кубического полинома определяются значениями о, vx vy в каждой вершине и значением v в центре тяжести; этот десятый узел нельзя передвигать. Кубический полином однозначно опреде- определяется этими десятью значениями, а вдоль каждой стороны — четырьмя значениями (функции у и ее производной по направ- направлению стороны в обоих концах этой стороны), и непрерывная стыковка обеспечена. В результате получится очень полезное пространство кубических пробных функций, которое мы обозна- обозначим через Z3 (рис. 1.11,в). Кусочно полиномиальные элементы из Z% легко описать вну- внутри области. О границе поговорим особо, здесь есть несколько 4»

100 I* ВВЕДЕНИЕ В ТЕОРИЮ возможностей. В случае главного условия и = О ограничением будет uh = 0. Если предполагать vh = 0 вдоль всей границы Г\ то и производные вдоль обеих хорд должны быть равны нулю, и в такой вершине не будет свободных параметров. Более удов- удовлетворительную аппроксимацию дает изопараметрическии метод разд. 3.3, или, в терминах переменных х, у, условие равенства нулю производной по направлению, касательному к Г. В послед- последнем случае мы должны отказаться от условия Дирихле vh = 0 на границе ГЛ и от его продолжения на истинную границу Г. Тогда функции uh будут действительно нарушать главное крае- краевое условие, обеспечивающее допустимость, и в таком варианте пространство кубических функций Z3 не будет подпространством пространства Дирихле ЖЪ. Тем не менее удается дать строгую оценку ошибки, возникающей при использовании таких недопу- недопустимых элементов; это один из основных результатов гл. 4. Можно ожидать, что функция vh близка к нулю на Г, и если вычислять по криволинейным треугольникам в Q, а не по обыч- обычным треугольникам в Qh, численные результаты будут лучше. Кубические элементы имеют еще одно важное дополнитель- дополнительное достоинство: неизвестные Qc, соответствующие узлам в центре треугольников, можно сразу исключить из системы ме- метода конечных элементов KQ = F и там останутся только неиз- неизвестные, соответствующие трем узловым точкам сетки. Такое исключение известно под названием статической конденсации. Оно связано с тем, что соответствующие базисные функции фс отличны от нуля только внутри одного треугольника, и каждое неизвестное Qc выражается только через другие девять пара- параметров в этом треугольнике. Таким образом, уравнение с номе- номером с можно разрешить относительно Qc через 9 «ближайших» параметров Q} и исключить Qe из системы, не увеличивая ши- ширины ленты. Число арифметических операций,прямо пропорцио- пропорционально числу отброшенных центральных точек, что необычно: в двумерных задачах общего вида нельзя исключить п узлов, произведя лишь an операций. Физически оптимальное переме- перемещение Qe в центре определяется полностью девятью парамет- параметрами, задающими перемещение вдоль границы элемента. Математически этот процесс можно рассматривать как орто- гонализацию базисных функций ср3- по отношению к каждой цен- центральной базисной функции фс. Разумеется, с помощью процес- процесса Грама — Шмидта всегда можно ортогонализовать весь базис и свести- матрицу жесткости к тривиальному виду /С =/, но это было бы безумием. Легче прямо решить систему KQ = F. Специальная ортогонализация по отношению к фс возможна, так как в ней участвуют только соседние 9 функций qjj и только внутри данного треугольника. Общее исключение неизвестных, отличное от обычного метода Гаусса, приводит к увеличению

J.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 101 ширины ленты матрицы, кроме специальных случаев — напри- например, четно-нечетной редукции, с помощью которой исключается каждый второй узел в пятиточечной аппроксимации уравнения Лапласа. Приведем еще один важный способ построения пространства 'кубических функций Z3, в котором не применяется статическая конденсация; центральные точки здесь не будут узловыми, а будет только 9 параметров — значения v, vx и vy в каждой вер- вершине. Соответственно нужно избавиться от лишней степени сво- свободы в кубическом полиноме. Потребуем, чтобы коэффициенты при х2у и ху2 в разложении vh = а, + а2х + а3у + й±х2 + а-оху + а$2 + a7xs + а8 (х2у + ху2) + а9у3 были равны. Это ограничение портит точность элемента; в даль- дальнейшем мы свяжем скорость сходимости со степенью полинома, аппроксимируемого точно в пространстве пробных функций, и увидим, что степень снижается в этом случае с 3 до 2. Тем не менее такие, кубические функции с ограничением относятся к наиболее важным конечным элементам, и многие инженеры предпочитают работать с ними, а не со всем пространством Z3. Узловые параметры таких функций очень-хороши. (Однако, как будет показано в разд. 4.2, оставшиеся 9 степеней свободы не инвариантны относительно поворота в плоскости х, у, и для некоторых направлений они даже не определяются однозначно девятью узловыми параметрами. Андерхегген предложил в ка- качестве ограничения \ \ vh = 0, а Зенкевич [7] рассмотрел еще одну, весьма привлекательную возможность.) Ни одно из описанных пространств нельзя применить для бигармонического уравнения, так как они не являются подпро- подпространствами в Ж2. (Вернее, их использование было бы неза- незаконно; Z3 с ограничением часто используется для расчета обо- оболочек. Элементы, несогласованные вдоль внутренних сторон треугольников, обсуждаются в разд. 4.2.) Поэтому, обозначив через ffi класс функций с непрерывными производными до по- порядка k включительно, мы хотим построить элементы, принад- принадлежащие классу 9". Существенно новое условие заключается в том, что производная по нормали должна быть непрерывна на границах между элементами. Функция из 9" автоматически принадлежит Ж2 и потому допустима для задач четвертого по- порядка; интегралы по Q можно вычислить на каждом элементе, если нет б-функций на границах. Существует несколько возможностей. Одна состоит в том, чтобы заменить кубические полиномы в Z3 рациональными функциями, выбранными так, чтобы уничтожить разрывы на сторонах в нормальных производных, не затрагивая при этом

102 1- ВВЕДЕНИЕ В ТЕОРИЮ узловых значений v, vx и vv. Функция vh становится кусочно ра- рациональной вместо кусочно полиномиальной, и опять умень- уменьшается точность; пространство не содержит произвольного ку- кубического полинома. Рациональные функции имеют, кроме того, другой важный недостаток: их трудно интегрировать и даже численное интегрирование приводит к серьезным трудностям (разд. 4.3). Рис. 1.12. Два треугольника соответствуют аппроксимации пятой степени (а — без огра- ограничений и б — с ограничением; функция vn — кубическая на каждой стороне) и макротреугольник соответствует кубической аппроксимации (в — кубические полиномы класса W1; Клаф — Точер). Если мы предпочитаем работать исключительно с полино- полиномами, то приходим к наиболее важной и остроумной конструк- конструкции— элементам пятой степени (рис. 1.12). У полинома пятой степени по х и у надо определить 21 коэффициент, из которых 18 определяются значениями v, vx, vy, vxx, vxy и vvv в вершинах. Вторые производные представляют собой изгибающие моменты, интересные с физической точки зрения; мы будем требовать их непрерывность в вершинах и получать их как результат про- процесса метода конечных элементов — они задаются непосред- непосредственно весовыми коэффициентами Qj. Далее, при существова- существовании вторых производных не возникает никаких трудностей на нерегулярной триангуляции. Полиномы пятой степени для двух треугольников на стороне между ними совпадают, так как три

1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ условия в каждой вершине — значения функции у и ее произ- производных us и vss по направлению стороны — однозначно опреде- определяют шесть его параметров в вершине. Остается так задать три дополнительных ограничения, что- чтобы производная по нормали vn была непрерывна между тре- треугольниками. Один способ — добавить к узловым параметрам значения vn в середине каждой стороны. Так как vn — полином четвертой степени от s вдоль стороны, он однозначно опреде- определяется этим параметром вместе со значениями vn и vns на кон- концах отрезка (нормаль в средних точках сторон треугольника при переходе в соседней треугольник тоже надо учесть). Эта конструкция приводит к полному пространству полиномов пятой степени класса е&1, построенному независимо по крайней мере " в четырех работах. Оно обеспечивает точность по перемещению О (h6), если краевые условия удачно аппроксимированы. С по- помощью конечных разностей такая точность, по-видимому, ни- никогда не достигалась для двумерных уравнений четвертого по- порядка. Другой столь же эффективный способ введения трех допол- дополнительных ограничений — потребовать превращения vn в куби- кубическую функцию вдоль каждой стороны, т. е. равенства нулю ведущего коэффициента в полиноме четвертой степени. При та- таком ограничении узловые значения vn и vns определяют кубиче- кубический полином вдоль стороны, и элемент принадлежит классу *?". Оценка ошибки для и — uh ухудшается с h6 до h5. В-то же время размерность пространства Sh существенно уменьшается (в отношении 9:6, см. табл. 1.1), и это достаточная компенсация. Действительно, по результатам серии численных экспериментов [К14] можно отдать предпочтение этим замечательным элемен- элементам. По общему признанию, с ними не всегда просто работать (непрерывность вторых производных может нарушаться в углах области, где точное решение и менее гладкое), но точность все равно остается высокой1). *) К такому классу относятся важные физические Задачи с дополнитель- дополнительными условиями. Для несжимаемой жидкости, например, полезно наложить ограничения div uh = 0 для всех пробных функций. Представители француз- французской школы (Крузей, Фортен, Гловинский, Равьяр, Темам) обнаружили, что хотя треугольники Куранта не соответствуют условиям, сходимость можно установить при использовании 1) квадратичных полиномов на плоскости и кубических в трехмерном пространстве, 2) полиномов пятой степени из класса Ф1 как функций тока в простран- пространстве двух переменных и полиномов четвертой степени, построенных диффе- дифференцированием полиномов пятой степени, для скорости поля, 3) несогласованных элементов, линейных иа треугольниках, но непрерыв* ных только в серединах сторон (разд. 4.2).

104 Ь ВВЕДЕНИЕ В ТЕОРИЮ Треугольные элементы Таблица 1.1 Тип элемента Гладкость Линейный Квадратичный Кубический Кубический 2з W <sa Wr Vx> Vy непрерывны в вершинах 3 6 10 10 2 3 4 4 л2 4л2 9л2 5л2 Z3 с ограничением 5-й степени 5-й степени, нормальная производная кубическая на сторонах Кубический на макротреу- гольнике Как выше плюс равные 9 коэффициенты при х2у, ху2 &, vxx, vxy, Vyy непре- 21 рывны в вершинах ®", vxx, vxy, vyy непре- 18 рывны в вершинах ®" ¦ 12 Зя2 9я2 6я2 Заметим, что для достижения гладкости Ч?1' элемента на треугольнике необходимо было задать даже вторые производ- производные в вершинах. Женишек [Ж 1] доказал по этому поводу инте- интересную теорему: для того чтобы кусочно полиномиальная функ- функция принадлежала классу фч на- произвольной триангуляции, узловые параметры должны включать все производные в узлах до порядка 2q включительно. Он построил такие элементы в пространстве п переменных, используя полиномы степени 2nq + 1; эта степень представляется минимально возможной. К счастью, существует способ обойти жесткое ограничение и все, же построить согласованный элемент класса Ф1. Он со- состоит в образовании «макроэлемента» из нескольких стандарт- стандартных элементов. Наиболее известен способ треугольника Кла- фа — Точера: комбинирование различных кубических полино- полиномов в трех подтреугольниках (см. рис. 1.12). Окончательными узловыми параметрами в большом треугольнике будут значения v, о, и в, в вершинах и значения vn в серединах сторон — всего 12 параметров. Гарантируется даже стыковка нормальной про- производной при переходе в соседний макротреугольник, так как эта производная есть квадратичная функция и потому она пол- полностью определяется вдоль стороны параметрами на этой сто-

1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 105 роне: значение vn в средней точке задано непосредственно, а в двух вершинах — косвенно, как комбинация vx и vv. Так как каждый из трех кубических элементов имеет 10 степеней сво- свободы, а макроэлемент — только 12 узловых параметров, нужно ввести 18 ограничений. Оказывается, это как раз и надо для достижения гладкости сёх внутри треугольника. Требование, что- чтобы v, vx и vy принимали одинаковые значения во всех внешних вершинах и в одной внутренней, и согласование vn во всех сред- средних точках сторон дают 18 ограничений. Предполагая, что данная триангуляция позволяет объеди- объединять треугольники по три в макротреугольники, мы нашли та- таким образом базис пространства -Sh .всех кусочно кубических функций класса сёх. Это один из случаев весьма важной и на вид очень трудной задачи — определить базис пространства ку- кусочно полиномиальных функций v(x\, ..., хп) степени k—1 класса гладкости 4?i между симплексами. Мы не знаем даже, как определить (при и >- 1) размерность такого пространства: в соответствии с табл. 1.1 кусочно кубические функции класса W1 имеют М = 6 параметров для каждой пары макротреуголь- макротреугольников и потому в среднем одно неизвестное для каждого исход- исходного треугольника1). Чтобы подытожить свойства кусочно полиномиальных функ- функций, описанных в этом разделе, сведем основные свойства в таблицу. В столбце d приведено число параметров, необходимое для определения полинома внутри каждой подобласти, т. е. число степеней свободы, если на соседние элементы не наложено ограничений. Целое число k—1 указывает на наивысшую сте- степень полинома, аппроксимируемого точно в данном простран- пространстве пробных функций; это означает, что полином степени k уже нельзя точно представить комбинацией пробных функций, и (как мы еще докажем) порядок ошибки и—uh равен O(hk). Наконец, N—размерность пространства пробных функций Sh в предположении, что Q — квадрат, разбитый на 2и2 малых квадратов, разбитых на два треугольника диагональю с накло^ ном +1. В N = Мп2, дается только основной член; будут, ко- конечно, дополнительные члены, зависящие от условий на гра- границе, но постоянная М самая важная. Коэффициент М для эле- "мента, каждая вершина которого является р-кратным узлом, на каждой стороне лежит q узлов и внутри каждого треуголь- треугольника содержится г узлов, равен p-\-3q-{- 2r. В любой триангу- триангуляции в одной вершине сходятся два или более треугольников: сумма углов треугольника равна 180°, а вепшине соответствует 360°. Далее, число сторон относится к числу треугольников, как *) Добавлено в корректурах: сейчас мы уже догадываемся, какова будет размерность пространства кусочных полиномов степени k — 1 класса гладко- гладкости (Sq, но ничего не представляем себе о конструкции базиса.

106 I. ВВЕДЕНИЕ В ТЕОРИЮ 3:2, поскольку каждая сторона принадлежит двум треуголь- треугольникам. Это объясняет веса 1, 2 и 3 при р, г и q. (Второе дока- доказательство: если внутри уже существующего треугольника вво- вводится одна новая вершина, это приводит к образованию допол- дополнительно трех сторон и двух треугольников.) Правило 1:2:3 выполняется для любого множества треугольников, и оно озна- означает, что в среднем на треугольник приходится М/2 неизвест- неизвестных. Возрастание р приводит к умеренному возрастанию раз- размерности и ширины ленты матрицы. Внутренние узлы также не страшны, так как их можно исключить с помощью статической конденсации, а узлы .на сторонах приносят наибольший вред и возрастание их количества сильно отражается на времени счета. Отметим, что при теоретическом сравнении двух конечных элементов эффективнее тот, который точно аппроксимирует многочлены, более высокой степени k—1. Ошибка тогда убы- .вает, как Chh, постоянная С зависит от конкретного элемента и от k-x производных от и. Поэтому в теоретическом плане един- единственным ограничением на скорость сходимости будет глад- гладкость и, и даже его можно устранить (разд. 3.2), улучшая сетку. Дело меняется, если, напротив, фиксировать требуемую точ- точность и искать элементы, дающие такую точность с наименьши- наименьшими затратами. Шаг сетки h здесь конечен, т. е. не является бес- бесконечно малым. Возникает вопрос: достаточно ли провести вы- вычисления лишь несколько раз, т. е. задача удобна для програм- программирования, или же затраты на программирование и приготов- приготовления оправдываются только при длительном использовании программы? Мы считаем, что элементы фиксированного по- порядка, подобные элементам в табл. 1.1, или другие сходные конструкции (такие, как элементы на. четырехугольниках, трех- трехмерные элементы) будут обеспечивать достаточную свободу вы- выбора при практическом применении метода конечных элементов. Теперь мы хотим обсудить прямоугольные элементы, кото- которые быстро завоевывают популярность. Они особенно хороши в трехмерных задачах, где один куб занимает тот же объем, что и 6 довольно сложных тетраэдров. (Нерегулярное разбиение на тетраэдры в трехмерном пространстве трудно осуществить даже с помощью ЭВМ.) Далее, на плоскости очень многие важные задачи решаются в прямоугольных областях или в областях, составленных из прямоугольников. Границу более сложной об- области нельзя удовлетворительно описать без использования тре- треугольников, но очень часто появляется возможность комбини- комбинировать прямоугольные элементы внутри области с треугольными около границы. Простейшая конструкция по аналогии с линейным элементом на треугольнике основана на кусочно билинейных функциях ¦ф ,=щ а\ + а2х 4- пъу Ц- а*ху в каждом прямоугольнике. Четыре

1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 107 коэффициента такой функции определяются значениями vh в вершинах. Вне четырехугольника пробная функция непрерывна, и ее можно применить к дифференциальным уравнениям вто- второго порядка. Базис строится с помощью интерполяции: q>j = 1 в /-м узле и ф) = 0 в остальных узлах. Поверхность, соответст- соответствующая фз, напоминает пагоду или по крайней мере то, как мы ее себе представляем, так что функцию ф3- будем называть функ- функцией-пагодой. Это произведение ty(x)ty(y) основных кусочно ли- линейных функций-крышек одной переменной; таким образом, про- пространство Sh — тензорное произведение двух более простых про- пространств. Это очень полезная конструкция. Важно отметить, что для произвольного .четырехугольника такие кусочно билинейные функции не будут непрерывными при переходе от одного элемента к другому. Предположим, что два четырехугольника прилежат к пря'мой у = тх + Ь. Вдоль этой общей стороны билинейная функция будет квадратичной; она линейна, только если сторона расположена горизонтально или вертикально. Квадратичный полином не определяется двумя узловыми значениями на концах стороны: на vh влияют и дру- другие узлы. Поэтому билинейные элементы можно использовать только на прямоугольниках. Правда, для общего случая четы- четырехугольника можно изменить координаты так, чтобы он стал прямоугольником, и тогда допустимы билинейные функции. Бо- Более того, эту замену переменных можно также описать билиней- билинейной функцией, так что в замене координат участвуют те же функции, что и в построении самого элемента. Это простейшие из изопараметрических элементов, которые подробно обсуж- обсуждаются в разд. 3.3. Билинейный элемент на прямоугольниках можно легко со- соединить с линейным элементом. Куранта на треугольниках, так как и тот и другой полностью определяются значениями vh в узлах. Возможны и другие комбинации: билинейную функцию на треугольнике с узлом в середине одной из сторон можно со- соединить с квадратичной функцией на соседнем элементе. Во- Вообще билинейные пробные функции лишь чуть-чуть «старше» линейных, так как они точно воспроизводят член второго поряд- порядка ху. Для лапласиада L =—А главная диагональ матрицы жесткости К, построенной с помощью билинейных элементов, пропорциональна 8, а остальные элементы пропордиональны —1 и соответствуют восьми соседним точкам на плоскости. В трех- трехмерном пространстве, очевидно, нужно рассматривать трилиней- трилинейные функции вида а\ + а^х + а3у + a.\Z + а^ху + a6xz + a7yz +] + asxyz; такая функция опять определяется значениями в углах. Так же, как билинейный элемент на прямоугольнике соот- соответствует линейному элементу на треугольнике, биквадратичные и бикубические функции соответствуют квадратичным и куби-

108 Ь ВВЕДЕНИЕ В ТЕОРИЮ ческим функциям класса W на треугольнике. (В многомерном случае это полиномы степени k — 1 по каждой переменной хи х2, ..., х„, обладающие kn степенями свободы внутри каж- каждого параллелепипеда.) Биквадратичные элементы использу- используются часто и описываются очень легко. На рис., 1.13 показано расположение узлов. Девять коэффициентов биквадратичного элемента определяются его узловыми значениями, и наличие трех узлов на каждой стороне обеспечивает непрерывность между прямоугольниками. Для бикубического элемента все ана- аналогично. Рис. 1.13. Расположение узлов при биквадратнчной и эрмитовой бикубической интер- интерполяции. Простая модификация биквадратичного элемента состоит в исключении внутреннего узла и уменьшении числа параметров до восьми. Это делается за счет удаления из биквадратичного элемента члена х2у2, вклад которого в аппроксимацию и незна- незначителен. Этот простой и удобный элемент принадлежит «сирен- дипову ') классу» элементов, описанному Зенкевичем. Практи- Практически он весьма полезен для четырехугольников с криволиней- криволинейными сторонами, особенно после замены переменных, перево- переводящей область в квадрат (разд. 3.3). Наряду с билинейным, этот элемент является самым полезным изопараметрическим элементом на плоскости'. Соответствующий трехмерный элемент определяется по 20 точкам и опять чрезвычайно удобен, так как не имеет ни внут- внутренних, ни кратных узлов. Его узлы лежат в 8 вершинах и на серединах 12 ребер параллелепипеда. Допускается объединение членов вида хау$гУ второй степени по одной из переменных, на- например x2yz, но не x2y2z или хг. ¦ 1) Происхождение термина объясняется в книге Зенкевича О., Метод конечных элементов в технике, изд-во «Мир», М., 1975., стр. 124.—Прим. перев.

1.9. ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 109 Элементы старшего порядка такого сирендипова типа на плоскости имеют Ар узлов, равномерно расположенных по пе- периметру прямоугольника, включая четыре угловые точки. Функ- Функции такого типа содержат все члены хау$, в которых а и р не превышают р, а наименьший показатель степени равен 0 или 1. Поэтому первый недостающий член — это х2у2, и k = А. Эти функции опять особенно полезны при преобразованиях коорди- координат, переводящих границы прямоугольника в произвольные по- полиномиальные кривые степени р; при этом мы избавляемся от нежелательных внутренних узлов. Существует несколько' очень хороших элементов (предло- (предложенных Клафом, Фелиппа и др.), в которых четырехугольник получается как объединение двух или более треугольников, так что полином изменяется от одного треугольника к другому вну- внутри четырехугольного макроэлемента. Расположение узлов и не- непрерывность между частями макроэлемента здесь довольно сложные. Мы опишем лишь один элемент другого типа, именно эрмитов бикубический элемент. Пробные функции снова будут кубическими по каждой переменной отдельно, ий=2] а{1х*у\ О^г, /^3, это дает 16 степеней свободы в каждом прямо- прямоугольнике. Параметры определяются значениями о, vx, vv и vxy в четырех вершинах1). Таким образом, размерность простран- пространства Sh намного меньше по сравнению с пространством обыч- обычных бикубических элементов, описанных выше и основанных на 16 различных узлах. Такой элемент можно понимать как естественное обобщение фундаментального одномерного эрмитова кубического элемен- элемента, описанного в разд. 1.7. В этом случае функция v = d\ -f- -f-*a2* + a3x2 -j- а^х3 определялась на каждом подынтервале зна- значениями v и vx на его концах. Такая конструкция обеспечивала непрерывность vx в узлах, а значит, и всюду, так что элемент принадлежал <&1. Стандартный базис в одномерном случае со- состоял из функций двух типов, ty(x) и а(х), интерполирующих значения функции и ее производных соответственно: Г 1 в узле х — Х]\ г|з< = \ _ со/ = 0 во всех узлах, ' (. 0 в других узлах. ' d\b da, ( 1 В узле х = Х[, у [, -—^- = 0 во всех узлах, т~" —1 л ах J ' dx I 0 в других узлах. На эти функции натянуты все кусочно кубические функции класса <&х. ') Этот элемент был предложен в технической литературе Богнером, Фок- Фоксом и Шмитом.

110 1. ВВЕДЕНИЕ В ТЕОРИЮ Эрмитово бикубическое пространство есть произведение двух эрмитовых кубических пространств* и четыре параметра в обыч- обычных узлах z = (Xj, y{) приводят к четырем соответствующим базисным функциям: Ф, = ty (х) $i (у), Ф2 = Ч>/(*)<°/@). Подчеркнем, что узлы должны лежать на прямоугольной ре- решетке. Прямые х == Xj в одном направлении и прямые у = yt в^другом могут быть произвольными, но их пересечения полно- полностью определяют двумерный массив узлов. Поэтому бикубиче- бикубические элементы применяются только на прямоугольниках (или, после простого линейного преобразования плоскости, на парал- параллелограммах). На прямоугольной области эрмитов бикубический элемент — один из самых лучших. Его гладкость непосредственно следует из гладкости базиса F1); так как гр и ю принадлежат сёх, их произведения также обладают этим свойством. Поэтому бику- бикубические элементы можно употреблять для уравнений четвер- четвертого порядка; пробные функции будут принадлежать Ж2. Даже смешанные производные d2v/dxdy все непрерывны. (Пользуясь этим, можно охарактеризовать эрмитово пространство Sh, не прибегая к базису; оно состоит из всех непрерывных кусочно бикубических функций и, у которых vx, vv и vxy непрерывны. Будем говорить в этом случае, что v принадлежит классу ^"¦'.)- Замечательно то, что из обычных соображений не следует до- дополнительная гладкость функций. Функция vxy квадратична вдоль каждой стороны и для двух соседних прямоугольников, однако совпадают только два значения vxy на концах -стороны, а по двум значениям нельзя определить квадратичный полином! Идею эрмитовой конструкции можно распространить на эле- элементы старшей степени 2q—1. В одномерном случае должно быть q разных функций, соответствующих двум функциям гр и со для кубического полинома; все их производные порядка меньше q будут равны нулю в узлах, за исключением p-fo функции (йр(х), у которой (д/дх)р-1ар = 1 в начале координат. Это наи- наиболее естественный способ построения базиса для кусочно поли- полиномиальных функций степени 2q— I с q— 1 непрерывными про- производными. В двумерном случае нужно рассмотреть все возмож- возможные произведения ap(x)apf(y), а это значит, что каждому узлу соответствует q2 неизвестных. Многие из них будут смешанными производными высокого порядка, так что конструкция слишком неэффективна при q > 3. Как всегда, число неиевестных можно уменьшить, предполагая дополнительную гладкость элементов. Предельный в этом направлении случай дают сплайны, обеспе-

1.9S ТРЕУГОЛЬНЫЕ И ПРЯМОУГОЛЬНЫЕ ЭЛЕМЕНТЫ 111 чивающие наибольшую возможную гладкость. В этом случае каждому узлу соответствует только одно неизвестное, а базис- базисными функциями служат В-сплайны ф(лг) на прямой и у(х)<р(у) на плоскости. Трудность, конечно, состоит в том, что в этой кон- конструкции различные элементы связаны между собой; краевые условия становятся сложнее и изопараметрические преобразо- преобразования (выводящие за прямоугольники) невозможны. Так как все эти пространства натянуты на произведения од- одномерных базисных функций, матрицы жесткости К также мо- могут допускать разложение на одномерные операторы. Грубо говоря, это происходит, когда в дифференциальном операторе L можно разделить переменные. На практике это встречается в параболических задачах, когда метод Галёркина приводит к неявной разностной схеме с двумерной матрицей массы М, или матрицей Грама, образованной из скалярных произведений функций фз, которую приходится обращать на каждом шаге по времени. Для разностных уравнений именно эта трудность по- породила метод переменных направлений, в котором обратная матрица приближалась с помощью обращений двух одномерных операторов. Для пространства, образованного как произведение одномерных, применима та же техника с обычной оговоркой,. что если область не в точности прямоугольная, то метод пере- переменных направлений дает хорошие результаты, но сходимость не доказана. Таблица 1.2 Прямоугольные элементы Тип элемента Гладкость d k N=Mn' Билинейный Биквадратичный Биквадратичный с ограничением Бикубический обычный Бикубический эрмитов Сплайны степени k — 1 Эрмитов степени k — 1 = 2q — 1 Сиреидипов, р > 2 <в9 <$<* a?k-2, ft-2 4 9 8 16 16 k2 k2 \p 2 3 3 4 4 k k 4 n2 An2 Зя2 9n2 4n2 n2 * q2n2 {4p-\)n* В табл. 1.2 M = p-\-2q-}-r для элемента с р параметрами в каждой вершине, q параметрами вдоль каждой стороны и г параметрами внутри каждого прямоугольника. Весовые коэф- коэффициенты равны 1, 2, 1 при любом разбиении области на че- четырехугольники: число вершин равно числу прямоугольников и равно половине числа сторон. В каждом координатном на- направлении берется п подынтервалов.

112 h ВВЕДЕНИЕ В ТЕОРИЮ 1.10. МАТРИЦЫ ЭЛЕМЕНТОВ В ДВУМЕРНЫХ ЗАДАЧАХ В этом разделе мы укажем последовательность операций, производимых ЭВМ в процессе построения матрицы жесткости К, т. е. в процессе получения дискретной системы метода конеч- конечных элементов KQ = F. Кроме того, кратко опишем вычисление составляющих вектора нагрузок F. Мы не собираемся излагать частные детали, которые могут понадобиться программисту, а хотим прояснить решающий фактор успеха метода конечных элементов: при практическом применении метода Ритца чрез- чрезвычайно удобны полиномиальные элементы, подобные рассмот- рассмотренным в предыдущем разделе, и, возможно, только они одни. Напомним сначала, как появляется матрица К. Функционал I(v), подлежащий минимизации," имеет в качестве основного члена квадратичное выражение a(v,v), представляющее собой во многих случаях энергию деформации (или, строго говоря, удвоенную энергию деформации). В методе Ритца v отыски- отыскивается в конечномерном подпространстве S пробных функций вида 2<7.,ф;;. (Верхний индекс h в этом разделе будет опускаться, так как метод Ритца применяется к фиксированному набору элементов.) Подстановка пробной функции v в функционал энергии приводит к квадратичному выражению от координат qjt описывающему энергию на подпространстве 5: a (v, v) = qTKq. F2) Элементы матрицы К являются энергетическими скалярными произведениями К& = o(q>j> fu)- На практике эти скалярные произведения вычисляются кос- косвенным образом. Основное здесь — это вычисление энергетиче- энергетического интеграла a(v,v) на каждом элементе е, другими слова- словами, на каждой подобласти разбиения Q. Каждая такая часть всей энергии имеет вид ae(v, v) = qTekeqe F3) по аналогии с F2). Вектор qe содержит только те параметры qj, которые вносят вклад в энергию на подобласти е. (Конечно, можно включить сюда все множество координат q$, вводя в мат- матрицу жесткости ke элемента нулевые компоненты. Но гораздо лучше выбросить все функции cpj, обращающиеся в нуль на под- подобласти е; тогда порядок матрицы ke будет равен числу d сте- степеней свободы.полиномиальной функции внутри е.) Для линей- линейных функций v = а\ + а2х + а3у на треугольниках, например, порядок матрицы ke будет d = 3 '). При обычном выборе базиса *) Девять элементов матрицы жесткости элемента для уравнения Лап- Лапласа возникают непосредственно из поточечных произведений сторон тре- треугольника: kxj = Si-Sjl2A, где А — площадь элемента. Все внедиагональные элементы k^ неположительны, если только треугольник не имеет тупого угла.

J.10. МАТРИЦЫ ЭЛЕМЕНТОВ В ДВУМЕРНЫХ ЗАДАЧАХ 113 три компоненты вектора qe будут равны значениям v в верши- вершинах треугольника е. Для квадратичного элемента d = 6, а для элемента пятой степени будет 18 степеней свободы, 4e \v ' vx> V Vxy Vxx> Vyy> V ' Vx< • • •> " > vx> • ")• Здесь, например, v2x — производная по x во второй вершине треугольника; она равна весовому коэффициенту .q} при базис- базисной функции qpj, производная по х от которой в этой вершине равна 1, а все остальные узловые параметры равны 0. В даль- .нейшем мы будем рассматривать элементы пятой степени на треугольниках в качестве основного примера, так как они наи- наиболее полно иллюстрируют возникающие трудности. Теперь перед нами две задачи: вычислить матрицы ke жест- жесткости элементов и собрать их в о'бщую энергию деформации a(v, v) = qTKq='EqTekeqe. е Последний вопрос — это вопрос эффективного хранения, зави- зависящий, в частности, от относительных параметров ЭВМ и задачи. Для очень больших задач одним из возможных способов орга- организации служит прямой метод, в котором упорядочиваются эле- элементы (подобласти), а не неизвестные. Матрицы для каждого элемента определяются по очереди, и по мере того как произво- производятся вычисления для каждого элемента, содержащего некото- некоторое неизвестное Qn, в соответствующей строке матрицы К вы- выполняются исключения и результаты запоминаются. Таким обра- образом, в данный момент хранится только несколько неизвестных, принадлежащих нескольким элементам, некоторые из которых уже вычислены, а некоторые — нет. В этом разделе мы уделим наибольшее внимание вычислению матриц элементов, распространяя на двумерные задачи технику, развитую в разд. 1.7 для эрмитовых кубических элементов. В конце раздела остановимся на численном интегрировании. Существенный момент здесь состоит в том, что при исполь- использовании полиномиального базиса ф^ на многоугольных (не кри- криволинейных) элементах энергия есть взвешенная сумма интегра- интегралов вида PTS=\\xrysdxdy. е Эти интегралы зависят от положения элемента е и от постоян- постоянных, которые можно протабулировать. Поэтому задача сво- сводится к нахождению удобной системы координат, в которой легко описать геометрию области е, и связи между узловыми параметрами qe и коэффициентами полинома v. Существует общее мнение, что «глобальные» координаты х, у не подходят,

114 I, ВВЕДЕНИЕ В ТЕОРИЮ и гораздо менее распространено, но все же принято считать, что локальная система координат наилучшая. Поэтому мы опишем пару возможностей. Первая заключается в том, чтобы перенести начало коорди- координат в центр тяжести (хо, г/о) треугольника е. Белл в [23] назы- называет полученную систему координат локально-глобальной. Так как преобразование линейно, полином сохранит пятую степень по новым переменным Х=х — xQ, Y = у — г/0: Легко найти узловые параметры qle8 в терминах этих коэффи- коэффициентов аи а именно если новые координаты вершин обозна- обозначены (Xt, Yi), то F4) и т. д. Для элемента с 21 степенью свободы нужно также вы- вычислить три производных в серединах сторон; узловыми пара- параметрами такого элемента будут qf — iq™, v\, v2n, vty. Связь с вектором коэффициентов А = (а\,..., й2{) можно записать в матричной форме: qf-=GA, F5) где первые 18 строк матрицы G задаются равенствами F4), а последние 3 включают не только координаты Хи У* вершин, но и ориентацию треугольника. Обращая F5), получаем Для элемента с 18 степенями свободы последние 3 строки матрицы G заменяются однородными ограничениями на коэф- коэффициенты aiy такими, чтобы нормальная производная vn вдоль каждой стороны была кубической функцией. Это приводит к соотношению о Обращая это уравнение, видим, что матрица Я, связывающая qe с Л, теперь содержит 21 строку и 18 столбцов:

1.10. МАТРИЦЫ ЭЛЕМЕНТОВ В ДВУМЕРНЫХ ЗАДАЧАХ 115 Для всякого элемента первый шаг состоит в нахождении мат- матрицы связи Н между узловыми параметрами q и коэффициен- коэффициентами полинома а. Вычислим теперь энергетический интеграл в терминах коэф- коэффициентов at. Например, для изогнутой пластины в разд. 1.8 этот интеграл имеет вид ае(v, v)=\\ (vxx + vYY + 2vvxxvYY + 2A - v) vXY) dXdY. e Подставляя сюда полином с v, получаем ae(v, v) = ATNA, F6) где матрица N требует вычисления интегралов Prs. Как только они вычислены, матрица жесткости элемента найдена. Из F6) при А = Hqe выводим ae(v> v) = qTeHTNHqe и окончательно ke=HTNH. F7) Таким образом, для нахождения матрицы жесткости ke эле- элемента е необходимо проделать вычисления двух типов: найти матрицу связи Н между узловыми параметрами и коэффициен- коэффициентами полинома и матрицу N, состоящую из интегралов от по- полиномов. Другой выбор системы локальных координат рекомендуют Купер, Коско, Линдберг и Олсон [К14]. В их системе геометри- геометрические величины а, Ь, с и 6 на рис. 1.14 приобретают первосте- первостепенное значение; они легко вычисляются по координатам вер- вершин (Х{,У{). Пробные функции в повернутых координатах | и v\ остаются- полиномами пятой степени. Поэтому вычисление но- новой матрицы jV, задаваемой интегралами от полиномов на тре- треугольнике, основано на удобной формуле - - _s+l /-.r + l / <\r+l\ rls\ v v ; ' (r + s + 2)! ' е Нам нужна также новая матрица связи Н, вычисляемая в два этапа. Сначала вычисляется матрица Н', связывающая в пло- плоскости. I, т] узловые параметры с коэффициентами полинома, а затем матрица вращения R, связывающая локальные и гло- глобальные координаты; Н = H'R. Детали полностью приводятся в [К14], и создается впечатление, что кубическое изменение нормальных производных у элементов пятой степени легко вно- вносится в такую.систему.

116 U ВВЕДЕНИЕ В ТЕОРИЮ Интегралы Prs = \\ XrYsdXdY можно вычислить без всяких вращений введением координат, связанных с площадями. Это наиболее естественные параметры, известные среди инженеров как треугольные координаты, а среди математиков как бари- барицентрические координаты. Здесь каждая точка описывается тремя координатами, в сумме всегда дающими единицу: t,\ + + ?2 + ?з = 1- Вершины треугольника е расположены в точках A,0,0), @,1,0) и @,0,1). Если эти вершины имели прямо- A r V г3 = (л?3,у3) X Рис. 1.14. Другой выбор системы локальных координат. угольные координаты (XuYi), (X2,Y2), (X3, У3)> то по линейно- линейности координаты (X, Y) и (?ь ?2. ?з) произвольной точки Р свя- связаны соотношением 7 = 7, У2 У3 k =S C2 • F8) 1/ 4 1 1 1 Л&/ \^3/ Геометрически ^ есть отношение площадей или расстояний'до противоположной стороны (рис. 1.15). В этих координатах ин- интеграл Prs, согласно F8), принимает вид = \ [ и теперь достаточно применить формулу интегрирования в ба- барицентрических координатах (Холанд, Белл [23, стр. 84]) iw>_ m\n\p\ (т ¦ •detfl.

МО. МАТРИЦЫ ЭЛЕМЕНТОВ В ДВУМЕРНЫХ ЗАДАЧАХ 117 С помощью этой формулы можно вычислить якобиан преобра- преобразования координат: при m = га = р = О в знаменателе остается 2! и определитель матрицы В в F8) равен удвоенной пло- площади А треугольного элемента. Холанд и Белл [23] приводят явные формулы для интегралов Prs в случае, когда начало координат расположено в центре тяжести треугольника. Замечательно, что при r-\-s<.6 эти интегралы имеют очень простой вид: Prs = cr+sA (ХМ + X2Y2 + ХТд, причем с\ = 0, с2 = 1/12, с3 = с4 = 1/30, Cs = 2/105. Из этих формул Белл получает матрицу жесткости ke для кусочно по- С = (о,од) Л-A,0,0) В [email protected],1,0) Рис. 1.15. Координаты, связанные с площадями, для треугольника. у длина PQ площадь ВРС длина AQ площадь ВАС ' площадь (ВРС+'СРА + АР В) площадь ВАС Л. линомиальных элементов пятой степени в применении к задаче об изгибе пластины. Заметим, что другие локальные системы координат могут полностью основываться на естественных координатах ^. В этом случае параметры qe, включающие узловые производные вроде vl , можно заменить производными по ?j. Нам кажется, что алгебраические выкладки при использовании такой системы гребуют довольно много времени (и опыта!), однако Аржирис и его коллеги в этой системе'успешно построили аналитически матрицу Н = G~l. Такая естественная система координат дей- действительно оправдана численными квадратурами.

118 Т, ВВЕДЕНИЕ В ТЕОРИЮ Теперь перейдем к вычислению матрицы массы М. Эта мат- матрица появляется в связи с интегралом \\v2dxdy в энергии. Другими словами, если записать v в виде Hq^j, то М будет матрицей Грама1), образованной из скалярных произведений базисных функций ф;-: Mjk = (<Pft, Фу) = [ ф*ф/ dx dy. Эта матрица играет основную роль при вычислении собствен- собственных значений. Так же, как и матрицу /С, матрицу массы можно построить из матриц массы элементов: \ \ v* = gTMq = ? qlmeqe = ? \ \ Л F9) Q - е Матрицу массы те элемента е можно, как раньше в случае ke, записать в виде me = HTZH. Здесь Н — та же самая матрица, связывающая параметры qe с коэффициентами полинома d Матрица 2 сразу получается из скалярных произведений! nj+nk. у Эти величины легко табулируются, и допустима любая локаль- локальная система координат. Таким образом, Z играет ту же роль для матрицы массы, что N для матрицы жесткости. В обоих случаях мы, конечно, считаем, что коэффициенты для элемен- элементов постоянны; если же материал пластины обладает перемен- переменными свойствами, которые нужно учитывать при расчетах, то следует применять численное интегрирование. Наконец, обсудим вычисление вектора нагрузок F, который стоит в правой части уравнения метода конечных элементов KQ = F. Его вычисляют также поэлементно: ') Мы хотели обсудить возникший каламбур «матрица Грама— матрица массы», но редактор сказал, что это успеется.

1.10. МАТРИЦЫ ЭЛЕМЕНТОВ В ДВУМЕРНЫХ ЗАДАЧАХ 119 Вычисление опять начинается с соотношения А = Hqe, связы- связывающего узловые параметры элемента и коэффициенты поли- полинома п\. В терминах этих коэффициентов miri = ?* = №*> G0 где компоненты rf-мерного вектора а определяются по формуле а, = J J fXm'Yn'. е Подставляя G1) в G0), получаем,' что вектор нагрузок, соот- соответствующий элементу е, равен Fe = Нта. В работе [К14] рассмотрены два специальных случая вычисле- вычисления Oi. Первый — это случай постоянной нагрузки f(x, г/) =/,0; здесь опять появляются затабулированные интегралы: Второй — случай нагрузки f(x,y) = fo6, сосредоточенной в точке (Хо,То)- Если эта точка лежит вне элемента е, то, разумеется, Fe =. 0; если же внутри, то а = f xmiYni °i 1оло * о ' Все вычисления опять можно проводить в любой локальной си- системе координат. При более общем виде вектора нагрузок f интегралы at можно вычислить либо с помощью квадратурной формулы на каждом элементе, либо с помощью интерполирования / элемен- элементом из подпространства Sh. В последнем случае определяются узловые параметры fj, т. е. значения функции / и ее производ- производных в узлах, и строится интерполяционный элемент // = Е //Ф/- G2) Замена f на fi дает возмущенный вектор нагрузок F с компо- компонентами М — матрица массы, описанная выше, /' — вектор, образован- образованный из узловых параметров fj. Эти вычисления проводятся сравнительно легко. Итак, мы рассмотрели только аналитическое вычисление матриц элементов, основанное на точном интегрировании по- полиномов на многоугольниках. Конечно, в подавляющем боло-

120 1< ВВЕДЕНИЕ В ТЕОРИЮ шинстве случаев такие матрицы вычисляются приближенно, с помощью некоторых квадратур Гаусса. Для криволинейных элементов, возникающих при расчете оболочек или при реше- решении плоских задач с криволинейными границами, численные квадратуры совершенно необходимы. В этом случае не только вектор F заменится на F, но и матрица К заменится на К. Это значит, что соответствующее решение Q будет решением метода конечных элементов возмущенной задачи. В последней главе мы оценим ошибку Q — Q; она должна зависеть от точности квадратурной формулы. Отметим, однако, что неточное численное интегрирование иногда может даже улучшить качество решения. Известен один пример (другой — для несогласованных элементов), в котором вычислительные эксперименты приводят к результатам, проти- противоречащим положениям математического анализа, но с вычис- вычислительной точки зрения верным и важным. Улучшение для ко- конечного шага h вытекает отчасти из следующего эффекта: точ- точный метод Ритца всегда соответствует слишком жесткой ап- аппроксимации и ошибки квадратурных формул уменьшают эту избыточную жесткость. Жесткость — внутреннее свойство метода Ритца. Ограничи- Ограничивая перемещения v конечным числом величин ерь cp2, . .., q>N вместо всех допустимых функций,, мы получаем численную структуру, более ограниченную, чем реальная. В задаче на соб- собственные значения такое ограничение выражается в том, что Я/ всегда больше истинного значения Xj. В статических задачах потенциальная энергия I(uh) превышает /(«), поскольку uh по- получается из минимизации I(v) на конечномерном подпростран- подпространстве, натянутом на фь <р2, ..., <р^у. Такая верхняя оценка / со- соответствует оценке снизу энергии деформации а, как доказано в следствии из основной теоремы 1.1: а (и*, ыА)<а(и, и). ' G3) В частном случае точечной нагрузки / = б(х0), когда пере- перемещение и(хо) пропорционально энергии деформации, оно также оценивается снизу в методе Ритца; более жесткая чис- численная структура дает меньшие перемещения в нагруженной точке, чем истинная конструкция. Для распределенных нагру- нагрузок тенденция та же: перемещение uh(x) в методе конечных элементов обычно ниже истинного перемещения и(х). Конечно, это не настоящая теорема, так как метод Ритца минимизирует энергию, а ее связь с перемещением не является строго моно- монотонной. Другими словами, uh может превышать и на некоторой части конструкции, но в то же время иметь меньшие производ- производные в среднем квадратичном. Тем не менее односторонние

1.10s МАТРИЦЫ ЭЛЕМЕНТОВ В ДВУМЕРНЫХ ЗАДАЧАХ 121 оценки и для перемещения, и для наклона те же, что и для ко- конечных элементов. Это можно изменить либо фундаментальной перестройкой процесса Ритца (см. прямой, смешанный и гиб- гибридный методы, описанные в следующей главе), либо намерен- намеренным введением численных ошибок. Последний эффект возникает в квадратурах Гаусса. Алгеб- Алгебраически он проявляется в уменьшении положительной опреде- определенности матрицы К; приближенная матрица К удовлетворяет неравенствам TKq Для всех q. G4) Может показаться парадоксальным, что это приводит к увели- увеличению энергии деформации в решении по методу Ритца, но па- парадокс легко объяснить. Новое решение будет Q = K~lF., Его энергия деформации равна QTKQ = FTK~'F, в то время как энергия невозмущенного решения была QTKQ = FTK~~lF. Так как неравенство G4) для матрицы жесткости равносильно об- обратному неравенству для обратных матриц, то FTK~1F^FTK~1F^0 для всех F; отсюда и следует возрастание энергии деформации. В случае точечной нагрузки р в /-м узле это приводит, как и в непрерывном случае, к тем же выводам относительно пер?- мещения. В векторе нагрузок F единственной ненулевой компо- компонентой будет Fj == р и перемещение в /-м узле будет равно Qi z=(K~1F)j = р(/С~')я- Если К уменьшится до К, то переме- перемещение возрастет до Р(л-1)«- Остается выяснить, почему квадратура Гаусса приводит к описанному эффекту уменьшения К- Очевидно, К будет умень- уменьшаться, если уменьшается каждая матрица элемента ke. Стро- Строгое доказательство для одномерного случая можно найти в ра- работе Айронса и Раззака [А7], где (vh)' разлагается в ряд по по- полиномам Лежандра. Энергия деформации на отрезке [—1,1] имеет вид q4eq = J ((АJ = \ («о + «.Л (* «-точечная квадратура Гаусса сохраняет все члены до а^_ включительно, так как они возникают из полиномов степени меньше 2п, и уничтожает член с а2п, поскольку Рп = 0 в узлах Гаусса (так определены полиномы Лежандра). Таким образом, в этом частном случае интеграл, очевидно, уменьшается и та

122 I. Введение в теорию же самая тенденция сохраняется в более общих задачах. При сравнении различных конечных элементов полезен критерий наименьшей матрицы жесткости. Математически он должен от- отражать аппроксимационные свойства элементов и, в частности, числовые постоянные, которые входят в аппроксимации полино- полиномов степени на единицу больше, чем у полиномов, точно ап- аппроксимируемых конечными элементами. С вычислительной точки зрения это очевидно, и ряд теоретически возможных эле- элементов сразу отбрасывается как слишком жесткие. Указанный критерий позволяет оптимизировать матрицу жесткости в пред- предположении, что точно аппроксимируются полиномы степени ft—1.

КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ 2.1. БАЗИСНЫЕ ФУНКЦИИ ПОДПРОСТРАНСТВ Sh В МЕТОДЕ КОНЕЧНЫХ ЭЛЕМЕНТОВ В настоящей главе мы собрали несколько основных резуль- результатов теории метода конечных элементов. Наша цель — описать общие рамки теории, в которой особое место отводится оцен- оценкам различных ошибок. В следующих главах мы будем рас- рассматривать каждую из этих оценок подробно. Сначала надо решить, какие подпространства Sh мы будем изучать. Для этого исследуем примеры, приведенные в гл. 1, и попытаемся выделить математически существенные свойства. Дадим соответствующее этим примерам общее описание ме- метода, называемого методом узловых конечных элементов. Оно будет фундаментом всей нашей теории. Каждая пробная функ- функция vh определяется своими узловыми параметрами — неизве- неизвестными <7j дискретной задачи. Каждый такой узловой параметр служит значением в заданном узле Zj либо самой функции, либо одной из ее производных. Таким образом, неизвестные можно представить в виде ql = Dlvk(zl), где дифференциальный оператор Д,- имеет нулевой порядок (DjVh.= vh), когда параметр служит значением функции, или равен одному из операторов д/дх, д/ду, д/дп, д2/дхду и т. д. Каждому из этих узловых параметров q$ поставим в соот- соответствие пробную функцию (fj, определяемую так: в точке г, значение Д,фз равно 1, а все остальные узловые параметры равны нулю. Заметим, что узлу Zj могут соответствовать не- несколько параметров, т. е. он может быть кратным узлом. Па- Параметр <7j определяется единственным образом не точкой zh а парой (Zj,Dj). Таким образом, основное свойство заключается в том, что каждая функция ф3- удовлетворяет равенствам D}4>i(zi)— 1 и Di4>i(zi)= О ПРИ i?=-j'- Дф/Ы = б(/. A) Функции фз образуют интерполирующий базис для простран- пространства пробных функций, так как каждую пробную функцию

124 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ можно разложить по функциям ф3-: Применяя к обеим частям равенства оператор Dt и вычисляя его в точке zt, убеждаемся, что qi = Divk(zi). Цель метода Ритца — минимизируя функционал I(vh), найти для этих параметров оптимальные значения Qj. Тогда пробная функция с этими оптимальными параметрами будет аппрокси- аппроксимацией метода конечных элементов: Рассмотрим пару примеров в этой общей постановке. Для общеупотребимых кусочно линейных функций на треугольниках '(треугольниках Тернера или Куранта) узлы г, — это вершины триангуляции, а операторы Dj все нулевого порядка: DjVh = vh. Неизвестные имеют вид qj = vh(Zj) и базис образован пирами- пирамидальными функциями, определяемыми равенствами ^(г^ = 6tj. То же справедливо для билинейных функций на четырехуголь- четырехугольниках и для квадратичных на треугольниках, но здесь множе- множество узлов Zj содержит и середины сторон. Для эрмитовых кубических функций одной переменной появляются производ- производные: каждый узел Zj участвует в двух парах (Zj, I) и (Zj,d/dx). Мы различали два вида базисных функций ф3- — функции ijjj и 0j. Для эрмитовых бикубических функций на каждый узел приходится четыре параметра, соответствующих v, vx, vy и vxy, т. е. оператор D равен I, д/дх, д/ду и д2/дхду. Для простран- пространства кубических функций Z3 на треугольниках узлы в вершинах тройные, а в центрах тяжести треугольников простые. В заключение описания метода узловых конечных элементов остановимся на геометрии области. Область Q разбивается на замкнутые подобласти е, пересекающиеся лишь по границам между элементами. Каждый элемент е содержит не более d уз- узлов Zj, и все базисные функции ф3-, кроме тех, которые соответ- соответствуют этим d узлам, равны нулю всюду на е. Таким образом, функции ф3- образуют и локальный базис. Эта схема представ- представляется достаточно общей, чтобы включать в себя большинство используемых пространств конечных элементов. Заметим тем не менее, что кубические сплайны не охватываются этой схемой, так как их базисные функции (В-сплайны) отличны от нуля на нескольких элементах. Обратим внимание на одно дополнительное свойство функ- функций ф3-, которое может оказаться полезным в теории метода. Это свойство появляется, лишь когда элементы построены гео-

2.1. БАЗИСНЫЕ ФУНКЦИИ ПОДПРОСТРАНСТВ S* 12В метрически правильно, т. е. область покрывается равномерной сеткой с шагом Лив каждом квадрате сетки узлы попадают в одинаковые позиции. Свойство базиса тогда представляет со- собой свойство инвариантности относительно переноса: если ба- базисная функция ф соответствует паре (z,D), а узел г сдвинут в новую точку z* = z + lh, то базисной функцией ф*, соответ- соответствующей паре (z*,D), будет перенос функции ф: ¦ ф*(*) = Ф(*-/А). B) В n-мерном случае / = (/ь ...,/„)—вектор с целочисленными координатами. Очевидно, что Dy*(z-\- lh) = Dq>(z) = 1; интер- интерполирующая функция ф просто сдвинута и получена функция л л Рис. 2.1. Узлы квадратичных функций из 'F0 на квадратной сетке. Ф*, интерполирующая в точке z*. Разумеется, у границы обла- области Q эта схема переносов нарушается, если только краевые условия не окажутся периодическими, в последнем случае можно считать, что базис обладает свойством периодичности. Рассмотрим в качестве примера пространство непрерывных кусочно квадратичных функций, описанное в разд. 1.7. Узлы попадают на равномерную треугольную сетку, причем (рис. 2.1) шаг сетки равен 1. Заметим, что каждой точке сетки можно поставить в соответствие единственное множество из четырех узлов; кружками отмечены узлы, сопоставляемые с началом координат, а крестиками — с точкой A,0). Отметим также, что число М == А базисных функций ф^ и неизвестных весовых коэф- коэффициентов qj в одном квадрате сетки отличается от числа d степеней свободы; d = 6 в каждом треугольнике. М — это ко- коэффициент в последнем столбце таблицы в разд. 1.9, связанный с размерностью пространства Sh. На единичном квадрате со свойством периодичности эта размерность равна M/h2. Обозначим через Фь Ф2, Фз и Ф4 базисные функции, интер- интерполирующие в узлах Z\, z2, z3 и z4 соответственно. Они кусоч- кусочно квадратичны и равны нулю в каждом узле, кроме своего собственного, этим они полностью определяются. Базисные функции для четырех узлов, соответствующих точке' сетки ituh), получаются как раз описанным выше переносом; этими

126 2, КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ сдвинутыми функциями будут Фг- (х — 1и У — h), i = 1, 2, 3, 4. Уменьшение шага сетки в h раз приводит просто к изменению масштаба в независимых переменных: четырьмя базисными функциями, соответствующими точке сетки (hh,l2h), будут /hl/hl) i) Эта схема переноса так полезна и важна потому, что мы по- положим ее в основу для второго общего описания метода конеч- конечных элементов. Эта форма метода применяется на равномерной сетке, назовем ее абстрактным методом конечных элементов. В «-мерном случае он начинается с выбора М функций Oi(%), ..., Фм(х), которые в конечном счете приводят к М не- неизвестным на каждом кубе сетки, и уравнение метода конечных элементов KQ = F принимает вид системы М уравнений, в ко- конечных разностях. Для построения базисных функций, соответствующих опре- определенной точке решетки, а именно началу координат, выберем просто масштаб переменной х = (xi,... ,хп) так, чтобы полу- получить Ф](д;//г), .... Фм(х/Н). Для построения базисных функций, соответствующих другой точке решетки lh = (/ь ...,/„) h, пере-, несем полученные только что функции. Таким образом, для обо- обозначения всех базисных функций, построенных таким способом (выбором масштаба и переносом), нам понадобятся два ин- индекса i и /: Ф*г(х) = Ф,(*//*-/), / = 1, .... М. Теперь осталось лишь потребовать, чтобы исходные функ- функции Ф{{х) были равны нулю вне некоторого шара \x\^.R. Тогда ф^ t будут равны нулю вне локального шара \х — lh\^. sg: Rh, и у нас снова будет локальный (возможно, не строго локальный) базис. Заметим, что в абстрактном методе конечных элементов не требуется, чтобы функции Ф3- интерполировали в некотором узле Z) и были кусочно полиномиальными. (Мы докажем, од- однако, что последние наиболее эффективны.) Интерполирующим свойством будет обладать любой базис, лежащий в пределах узлового метода конечных элементов, но наша абстрактная тео- теория этим свойством не пользуется. В качестве примера рассмот- рассмотрим кубические сплайны одной переменной. В этом случае М= 1, и подходящий выбор для Ф1 — это -б-сплайн, приведен- приведенный на рис. 1.9. Пространство Sh всех комбинаций 2 q^ t тогда совпадает с пространством сплайнов, т. е. дважды непре- непрерывно дифференцируемых кусочно кубических функций, сты- стыкующихся в точках л: = О, ±А, ±2А, .... Существенно, что В-сплайн Ф! не является интерполирующим, он отличается от нуля на четырех интервалах вместо двух, позволенных в узло-

2.1. БАЗИСНЫЕ ФУНКЦИИ ПОДПРОСТРАНСТВ S" 12? вом методе, и, в частности, он не равен нулю в трех узлах вместо одного. Подпространство сплайнов Sh, приемлемое для абстракт- абстрактного метода конечных элементов, успешно применялось в одно- одномерных приложениях. Построение уравнения KQ = F и задание границы требуют изменений в технике, стандартной для узло- узлового метода, но основные правила по-прежнему одинаковы для любой формы метода Ритца. Главное преимущество сплайнов в том, что дополнительная непрерывность уменьшает размер- размерность пространства пробных функций без понижения степени аппроксимации. В узловом случае эрмитовы кубические поли- полиномы определяются на каждом подынтервале значениями оно' в его концах (это означает, что на каждую точку сетки прихо- приходится М = 2 параметров). Порождающие функции cDt и Фг изображены на рис. 1.8 (функции я|з и и соответственно). В двумерном случае также были проведены эксперименты со сплайнами, уменьшение числа М здесь еще значительнее, а вы- выбор границы почти вынужден для обеспечения ее регулярности, сопоставимой с простотой узлового метода. Уменьшение ши- ширины ленты матрицы жесткости К, разумеется, не следует из понижения числа М; у кубических сплайнов одной переменной в каждой строке матрицы К по семь ненулевых элементов, так как В-сплайн <Di распространяется на четыре интервала. Фак- Фактически та же ширина ленты в случае эрмитовых полиномов, когда обычное упорядочение неизвестных дает матрицу вида /х х\ /х х\ /х х\ \х х) \х х) \х х) / х х\ / х х\ / х х\ \х х) \х х) \х х) Число М непосредственно влияет на порядок матрицы К и сплайны становятся эффективнее (по крайней мере в смысле времени решения), когда область Q — прямоугольник. Это под- подтверждается вычислениями в гл. 8. Мы искренне верим, что узловой метод позволяет такую гиб- гибкость в- отношении геометрических свойств, что в дальнейшем его применение будет предпочтительнее сплайнов. Несмотря на то что интерполирующее свойство несущественно для теории, удобнее иметь равномерную сетку, чтобы можно было исполь- использовать общее описание в терминах функций Фь. ..., Фм. Так как конструкция пространства Sh целиком зависит от этих функций, они должны содержать в себе ответы на все наши во-

128 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ просы об аппроксимации и численной устойчивости. Поэтому этот абстрактный подход сводит значительную часть теории метода конечных элементов к соответствующей задаче теории функций. 2.2. СКОРОСТИ СХОДИМОСТИ Предположим, что и — решение n-мерной эллиптической ва- вариационной задачи порядка т. Это означает, что и минимизи- минимизирует I(v) на допустимом классе Же, определяемом однород- однородными или неоднородными главными краевыми условиями, и что (в силу эллиптичности) энергия деформации положительно определена: a(v, v)^a\\vfm. Предположим также, что uh — функция, минимизирующая I(v) на пространстве пробных функций Sh, a uh — решение задачи, возмущенной ошибками численного интегрирования, координаты вектора uh удовлетво- удовлетворяют уравнению KQ — F. Предположим, наконец, что пн пред- представляет собой фактически вычисленное решение, отличаю- отличающееся от uh из-за ошибок округления численного решения. Оче- Очевидно, что три приближения uh, Uh, uh содержат нарастающим образом источники ошибки. Мы хотим выяснить порядки вели- величин этих ошибок для задач с гладкими решениями и для типич- типичных конечных элементов. Начало всегда одинаково: если Sft — подпространство в Ж™, то по основной теореме 1.1 a(u-uh, u — uh)= min а {и - vh, и - vh). C) Теорема остается справедливой для неоднородных главных условий, когда разность двух любых функций из Ж? принад- принадлежит VQ, а- разность двух любых функций из Sh принадлежит So, где Sg — подпространство в Vo- (Доказательство €м. в разд. ^.4.) Поэтому оценка энергии деформации разности и — uh составляет вопрос чистой теории аппроксимации: оценить рас- расстояние между и и Sh. Основные гипотезы таковы: во-первых, степень пространства Sh равна k — 1 (Sh содержит в каждом элементе полный полином этой степени, подчиненный лишь у границы главным условиям) и, во-вторых, базис его одноро- однороден при А-*-0. Последнее в действительности представляет со- собой геометрическое условие на элементарные области: если диаметр области е; равен hu то ег содержит шар радиуса не менее т/гг-, где т строго больше нуля. Это ограничение не до- допускает произвольно малые углы в треугольных элементах. В четырехугольниках также не допускаются углы, близкие к п.

2.2, СКОРОСТИ СХОДИМОСТИ 129 При этих условиях расстояние между и и Sh равно Поэтому скорость сходимости энергии деформации равна Вид этой оценки — типичный результат численного анализа. Отметим три факта. Показатель степени у h найти проще всего, так как он зависит лишь от степени полиномов. Он указывает скорость сходимости по мере измельчения сетки, этот эффект наблюдается при численном решении. Константа С зависит от конструкции элемента и его узловых параметров. Для правиль- правильных геометрических фигур можно найти хорошее асимптотиче- асимптотическое значение С как ошибку в аппроксимирующих полиномах степени k (разд. 3.2). Третий множитель \u\h отражает свой- свойства самой задачи, т. е. степень гладкости ее решения, и потому его легко оценить точно. Эта норма есть среднеквадратичное значение k-я производной от и и потому — в соответствии с тео- теорией уравнений в частных производных — связана непосред- непосредственно с производными порядка k — 1т от функции /. Заметим, что сходимость имеет место тогда и только тогда, когда k > m; другими словами, условие постоянной деформа- деформации таково, что элементы должны воспроизводить точно любое решение, являющееся полиномом степени т. Это требование для обеспечения сходимости постепенно появилось в техниче- технической литературе, оно возникло отчасти интуитивно, а отчасти из-за вычислительных неудач, связанных с нарушением этого правила (особенно заметных при изгибе пластины в бигармони- ческом случае т = 2, когда пространство Sh не содержит член ху). Мы дадим строгое доказательство (насколько нам изве- известно, первое) необходимости этого условия для сходимости в случае равномерной сетки. Такая теорема естественно соот- соответствует абстрактной теории метода конечных элементов, до- допускающей наиболее общие пробные функции на равномерных разбиениях. Мы сформулировали условие постоянной деформации так, как если бы оно было также необходимо и для неравномерных сеток, но это не так. По крайней мере не совсем так. Область Q можно отобразить в другую область Q' фиксированным глад- гладким обратимым преобразованием Т, не сохраняющим полино- полиномов, а тогда элементы, удовлетворяющие на Q условию по- постоянной деформации, не удовлетворяют ему в новых перемен- переменных. Тем не менее сходимость на Q влечет сходимость соответ- соответствующей задачи на Q', так что с помощью Т можно перехо- переходить от одной области к другой. Влияние якобиана на ошибки для изопараметрических элементов разбирается в разд. 3.3. 5 Зак. 287

130 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ Сходимость энергии деформации есть по существу сходи- сходимость производных порядка.т от функции uh к соответствую- соответствующим производным от и. Эта производная, следовательно, осо- особая, поскольку в методе Ритца минимизируется энергия. Для производной порядка s, где s может быть больше или меньше т, сходимость не может быть' быстрее, чем О(hh~l), т. е. чем порядок наилучшего приближения и в пространстве Sh степени k—1. Такая скорость сходимости обычно достигается реше- решением uh метода Ритца. Используя прием Нитше, дающий ско- скорость О (/г2) -для перемещения в случае одномерных линейных элементов в разд. 1.6, покажем, что |B-BfcL-O(A»- + A2»-"'). D) Первый показатель почти всегда меньше, и скорость сходимости определяется теорией приближений. (Для s = —1 левая часть представляет собой осредненную по элементу ошибку в переме- перемещении, и мы видим, что она может быть на один порядок лучше (hh+l), чем сама ошибка в перемещении.) Тем не менее изве- известны случаи, когда член /z2<ft-m) играет главную роль: если вооб- вообразить применение кубических сплайнов к задаче шестого по- порядка или, что реальнее, если для задачи изгиба пластины (уравнение четвертого порядка) взять только квадратичные функции на элементах, то скорость может быть ограничена по- порядком 2(k — т) = 2 даже для перемещений. При условии, что в каждой точке решение и имеет k произ- производных, скорость сходимости в отдельных точках ожидается такой же. (При наличии особенностей степень дифференцируе- мости и, следовательно, скорость сходимости совершенно раз- различны в поточечном и среднеквадратичном смыслах. Мы не приводим детального доказательства оптимальных оценок оши- ошибок в точках.) В специальных точках ошибка действительно может сходиться быстрее, чем в среднем. Например, для задачи —и" = / узлы линейных элементов специфичны: uh = их и ре- решение Ритца в этих узлах точное. Это вообще справедливо, если элементы служат решениями однородного дифференциального уравнения [XI, Т5]. Для уравнения теплопроводности Томе от- отметил особую скорость сходимости в узлах сплайнов, Дуглас и Дюпон расширили этот принцип на свои методы коллокации. Скорость сходимости сохраняется для неоднородных крае- краевых условий (разд. 4.4), если только краевые данные интерпо- интерполируются (или приближаются) полиномами по крайней мере той же степени k— 1. Для области Q неправильной.формы может появиться новый тип ошибки аппроксимации. Обычно бывает необходимо ап- аппроксимировать границу Г кусочно полиномиальной границей

2.2. СКОРОСТИ СХОДИМОСТИ 131 Гл. В простейшем случае ГЛ кусочно линейна; Q заменяется многоугольником Qft. Такой многоугольник можно разрезать на треугольники и применять далее метод конечных элементов без учета полосы Q — uh между -исходной границей Г и много- многоугольником. Следовательно, мы как будто вдвигаем исходную дифференциальную задачу в пн. В разд. 4.4 исследуется влия- влияние этого изменения области. Кратко это влияние таково: ошибка m-й производной у границы равна О (Л), но быстро убывает внутри области. Это приграничный эффект, средняя ошибка равна О(/г3/2). Так как энергия деформации зависит от квадрата этой производной, то ошибка в энергии, обусловлен- обусловленная вычислением на Qft (с естественными или главными крае- краевыми условиями), равна О (Л3). Эта оценка применима к Q, как и к Qft, если решение метода конечных элементов доопределить естественным образом, распространяя каждый полином вплоть до Г. В противном случае вся энергия в полосе будет потеряна, а это составляет O(h2) — пропорционально объему полосы. Заметим, что ошибка /г3, вызванная изменением области, преобладает, когда степень конечных элементов, используемых внутри области, превышает т. Если взяты полиномы минималь- минимальной степени т, необходимой для сходимости, то эффект от из- изменения области поглотится (по крайней мере внутри uh) ошибкой /г2^-™1' = /г2, возникающей из обычной теории прибли- приближений. Если граница Г приближается кусочно полиномиальными функциями степени выше I, то соответственно уменьшается и ошибка от изменения области. Ошибка в т-й производной (деформация) у границы равна 0{Ы), а в общей энергии де- деформации в Qh равна O(h2l+1). В случае главного условия и = О это означает, что оно точно выполняется для пробных полиномиальных функций на приближенной границе. Митчелл нашел изящную конструкцию кубических элементов, равных нулю на границе, составленной .из гипербол, с ошибкой /г5 в энергии деформации и Л3 в перемещении. Для главного условия на криволинейной границе (например, и = 0) можно также взять любые стандартные .элементы и по- потребовать, чтобы они интерполировали условия в граничных узлах. В этом случае пробные функции не будут удовлетворять главному условию на всей границе, каждая пробная функция может обращаться в нуль вдоль некоторой кривой, близкой к Г, но для разных функций эти нулевые кривые будут раз- различны. В результате теория Ритца неприменима: пробные функ- функции не принадлежат Ж^ ни на точной области Q, ни на при- приближенной Qh. Кроме того, функция. uh, минимизирующая l(v), Не будет ближайшей пробной функцией к и. Тем не менее можно оценить ошибку, принимая во внимание, что каждая

132 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ функция vh не равна нулю, но мала на границе. Наилучшая оценка ошибки в энергии деформации (удивляющая своей ма- малостью) обычно порядка А3. Грубо говоря, если мы работаем с кубическими функциями на треугольниках и интерполируем главные краевые условия, то наихудшая функция будет нару- нарушать условия с величиной O(h3/2) между узлами; в разд. 4.4 мы выведем из этого утверждения, что ошибка в энергии равна O(h3). Существует еще одна альтернатива, несомненно, наиболее распространенная. Криволинейные элементы с помощью преоб- преобразования координат можно выпрямить. Такое преобразование может оказаться даже необходимым для достижения непрерыв- непрерывности между четырехугольниками с уже прямыми сторонами, если только это не прямоугольники. Это преобразование коор- координат представляет собой центральный прием в технике метода конечных элементов. Теоретически можно выпрямить почти любую граничную кривую, но практически это, конечно, неосуществимо. Кусочно полиномиальные функции являются наилучшими границами элементарных областей по тем же причинам, по каким они наи- наилучшим образом приближают перемещения: с ними удобно ра- работать на ЭВМ. В самом деле, выбор координат можно описать тем же классом полиномов, из которого берутся пробные функ- функции; это метод изопараметрических преобразований. Идея эта превосходна. Выбор координат приводит к тем же трудностям, что и для пробных функций: преобразование должно быть не- непрерывным при пересечении границ элементов, так что эле- элементы, соседние на исходной плоскости х, у, остаются сосед- соседними на плоскости |, г\. Если'преобразование хA,г\), г/(|,г|) построено стандартным образом из узловых параметров и мы убеждены в непрерывности по % и г| (как для стандартных пря- прямоугольных или треугольных элементов), то изопараметриче- ские преобразования приведут к успеху даже для элементов, границы которых — полиномы степени k—\ no x и у. Этот при- прием ставит новые вопросы теории приближений, так как поли- полиномы по | и т). не будут более полиномами по х и у. Тем не менее изопараметрические преобразования не понижают по- порядка точности; если преобразования равномерно гладкие (разд. 3.3), то полная степень hk~s в s-й производной дости- достигается. В этом смысле изопараметрический прием представ- представляется наилучшим для уравнений второго порядка и криволи- криволинейных границ. С главным краевым условием и — g можно ра- работать просто и эффективно без потерь в основном порядке точности. Мы рассматривали пока вклад в и—иь только от перечис- перечисленных ошибок, считая, что приближение Ритца вычисляется

2.2. СКОРОСТИ СХОДИМОСТИ 133 точно. На практике, однако, есть еще ошибки в численном ин- интегрировании (получаем uh вместо uh) и при решении заклю- заключительной линейной системы (получаем пн вместо пн). Надо знать величину ошибки интегрирования, чтобы выбрать квад- квадратурную формулу, не требующую- больших затрат времени и не нарушающую точность. В примере в гл. 1 упоминались две основные возможности: A) неоднородные данные и любые су- существенные коэффициенты, которые изменяются вместе с х, можно заменить интерполирующими полиномами, и тогда ин- интегралы для полученной задачи вычисляются точно; B) инте- интегрирование по всем элементарным областям можно выполнить с самого начала по стандартной квадратурной формуле, скажем по квадратурам Гаусса. Для простой задачи типа —(/?«')' + -\- qu = / допускается некоторая свобода выбора. Напомним один теоретический результат: и интерполяция полиномами степени к—1, и квадратура Гаусса по k—1 точкам дают ошибку в деформациях порядка hh. Для более сложной задачи нужно применять метод B), и в действительности численное интегрирование стало одним из главных моментов метода ко- конечных элементов. Оно дает решение пн, сходящееся к и при условии определенной точности численных квадратурных фор- формул: производные порядка т у всех пробных функций должны интегрироваться точно. Для каждой дополнительной степени точности ошибка uh — uh, возникающая из численных квадра- квадратурных формул, улучшается на некоторую степень величины А. Доказательство основано на тождестве, приведенном в разд. 4.3. Таким же способом определяется повышенная точность для изопараметрических элементов. Наконец, ошибки округления. Их характер совершенно от- отличен от характера других ошибок — они пропорциональны от- отрицательным степеням величины А. При убывании А существует зона пересечения, в которой порядки ошибок округления и ап- аппроксимации совпадают и до которой округление незначительно и неинтересно, а после нее чрезвычайно важно. Округление слабо зависит от степени полиномов и от размерности. Ключе- Ключевой множитель А~2т устанавливается шагом сетки и порядком самого уравнения. Для уравнения второго порядка шаги сетки, типичные для практических.задач, еще не входят в зону пере- пересечения, но для уравнений четвертого порядка это не так: вы- вычислительная точность может потребовать проведение опера- операций с двойной мантиссой. В гл. 5 мы обсудим и априорные оценки числа обусловленности, и апостериорные оценки округ- округления, действительно совершаемого в данной задаче. Это главные ошибки, анализируемые в линейных стационар- стационарных задачах Lu =f. В каждом случае анализ основан на основ- основном вариационном уравнении а(и, v) — (f, v) = 0. Нет сомнения,

134 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ что по сравнению с конечными разностями этот анализ приво- приводит к более последовательной и удовлетворительной математи- математической теории. Частично эту технику можно распространите на нелинейные уравнения. В настоящее время выдающуюся ма- математическую проблему представляет выделение классов нели- нелинейных задач, физически важных и математически доступных, и изучение зависимости приближения от пространств пробных функций, областей и коэффициентов. Значительный успех в этом направлении достигнут Лионсом (см. [10]). Уже выделены два класса как простейшие обобщения линей- линейных эллиптических уравнений. Мы не знаем, насколько исчер- исчерпывающи их приложения в технике и физике, но появились они весьма естественно. Один из них — класс строго монотонных операторов, удовлетворяющих неравенству [М (и) - М (у)] (и - v) dx > а || и - v \fm. Я Другой (близкий к нему) класс содержит потенциальные опера- операторы, для которых М — градиент некоторого неквадратичного выпуклого функционала I(v). Для знакомства с теорией реко- рекомендуем книгу Вайнберга [4]. К этим операторам непосредственно применяется метод Га- лёркина: отыскивается такая функция ый=?<Э/Ф/ из подпро- подпространства Sh, что (M(uh), qpft) = O для всех qpft. Число (нелинейных) уравнений равно числу неизвестных коэф- коэффициентов, т. е. размерности пространства пробных функций Sh. Для двух описанных выше классов можно доказать суще- существование такого решения uh и его сходимость к и при условии, что на оператор наложены подходящие требования непрерыв- непрерывности. В самом деле, схема одного из возможных доказательств существования решения и такова: доказывается существование uh в конечномерном пространстве и дается априорная оценка, устанавливающая, что все uh принадлежат некоторому ком- компактному множеству; тогда последовательность *uh должна иметь предельную точку при h ->• 0; этой точкой и будет и. Сиарле, Шульц и Варга [С6] показали, что оценки ошибки для линейных и нелинейных монотонных задач отличаются незна- незначительно. Метод конечных элементов широко применяется в нелиней- нелинейных задачах, например для упруго-пластичных и термовязко- пластичных материалов. В дополнение к книге бдена [17] по- появилась и быстро разрастается техническая литература; ука- укажем лишь ранние обзорные статьи Мартина [М5] и Маркала

2.2. СКОРОСТИ СХОДИМОСТИ 135 [М4]. Здесь полезно повторить возможные формулировки ме- юда конечных элементов, отличающиеся приемами работы с геометрическими нелинейностями, возникающими из-за силь- сильного изгиба, и с существенными нелинейностями, без особого фивлечения математики. Очевидно, что проблема сходимости хорошо поставлена, чрезвычайно интересна и созрела для ре- решения. Надеемся, что в конечном счете эта математическая теория станет достаточно законченной и ей можно будет посвя- посвятить целую книгу (это кто-нибудь сделает!). Приведем одно предостережение о нелинейных уравнениях, оно относится к задаче нелинейной упругости. Возьмем про- простую модель минимизации функционала вида I(v)=\[p(v, vx)vl-2fv]dx: Так как он не квадратичен по v, равенство нулю первой вариа- вариации не приводит к линейному уравнению для и. Поэтому обычно проводятся итерационные процессы, простейшим из ко- которых является метод последовательной подстановки: вычис- вычисляется нелинейный коэффициент для л-го приближения ип и ип+\ определяется как решение линейной задачи. Наше предостережение: если такой итерационный процесс проводится в вариационной задаче, так что un+i минимизирует интеграл то итерации сходятся к неверному ответу. Читатель легко про- проверит, что предел и* такого итерационного процесса удовлетво- удовлетворяет равенству которое не является уравнением виртуальной работы для I(v). (Достаточно положить р = vx.) Ошибка произошла из-за того, что последовательные подстановки осуществлялись до взятия первой вариации. Если сначала установить нелинейное уравне- уравнение для минимизирующей функции и, а затем решать это урав- уравнение итерациями, то предел получился бы правильным. Изложим одну частную нелинейную задачу, описывающую деформацию упруго-пластичного материала, которая иллю- иллюстрирует как возможности, так и трудности в доказательстве нелинейной сходимости. Она будет полезной для выявления не- некоторых деталей. Для простоты обозначений рассмотрим одно- одномерную модель с напряжением du/dx; те же рассуждения при- применимы к системе напряжений ец для двумерной и трехмерной

136 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ задачи упругости. Деформация представляет собой нелинейную функцию внешних сил, и ее нельзя определить лишь из окон- окончательной нагрузки. Она зависит от истории задачи, т. е. от хронологического порядка, в котором силы прилагались к об- области. Это вводит искусственный параметр «времени», и в за- заданный момент t скорость изменения деформации й минимизи- минимизирует функционал I(v)=\[p(vxJ-2fv]dx. Определяющей величиной служит модуль упругости р(х). Если этот коэффициент не зависит от напряжений в материале, то в искусственном времени нет необходимости, окончательную де- деформацию и(Т) можно определить простой минимизацией (как и всюду в этой книге) с помощью окончательной нагрузки f(T). В случае нелинейного закона напряжения-деформации коэффи- коэффициент р в момент t зависит от напряжений, и не Только от их значений в данный момент: он зависит от всей истории напря- напряжений. Такая зависимость от способа действия физически вво- вводится несколькими способами. Например, как только предел упругости превышен, нагрузка, следующая за равной разгруз- разгрузкой, оставляет изменение сети напряжений в материале. Это явление действительно создает в каждый момент времени не- нелинейную задачу для и, поскольку модуль упругости зависит тогда не только от прошлой истории, но и от текущего темпа изменений. На коэффициент р влияет знак произведения vxvx, и он принимает разные значения для нагрузки и разгрузки. Для простоты мы будем избегать эту дополнительную трудность и предполагать отсутствие разгрузки. Несмотря на то, что на- напряжение— однозначная функция деформации, мы не требуем, чтобы она вычислялась из известных деформаций их(х) в каж- каждый момент времени т ^ t. В аппроксимации Ритца uh — это функция из подпростран- подпространства пробных функций Sh, минимизирующая функционал В заданный момент t коэффициент ph(x) не принимает то же значение, что и истинный модуль р. Вместо этого он зависит от истории аппроксимаций Ритца ы?(т), т^?. Для доказатель- доказательства сходимости надо предположить, что если эти приближен- приближенные деформации близки к истинным, то коэффициент ph в дан- данный момент близок к истинному значению р: t max | р (х) - р» (х) | < С \ \\ йх (т) - й* (т) || йт. * о

2.2. СКОРОСТИ СХОДИМОСТИ 137 Для доказательства сходимости надо оценить, насколько функция uh, минимизирующая I(vh), и ее производная по х, т. е. скорость изменения деформации, зависят от коэффициента р в вариационном принципе. Наш план состоит в расщеплении ошибки в момент времени t на две части: где wh — функция, минимизирующая I(vh) на всем простран- пространстве пробных функций Sh, если в момент t брался истинный коэффициент упругости р. Другими словами, первая часть ошибки вызвана аппроксимацией, вторая — изменением коэф- коэффициента упругости. Для первой части можно привлечь обыч- обычную теорию приближений: задача линейна в каждый момент времени, а ошибка в первых производных для пространства степени k— 1 оценивается неравенством Относительно второй части ошибки см.. разд. 4.3. Там утвер- утверждается в качестве следствия, что эффект от изменения коэф- коэффициентов оценивается неравенством I wx (t) - йх (t) fl < С" max| р(х) - р» (х) |. Сравним два последних неравенства и запишем ё = «Л — й.%: t 11 ё (t) || < С'А*-« + СС" \ II ё(х) || йт. о Это в точности ситуация, к которой применимы доводы, приво- приводящие к лемме Гронуэлла: разделим неравенство на его пра- правую часть, умножим на СС" и поинтегрируем по t: ( С'Л*-1 + СС" J II ё (т) || dx J - ^ о ' ln( С'Л*-1 + СС" J II ё (т) || dx J - In {С'№-х) < CC't. ^ о ' Потенцирование обеих частей и подстановка в предыдущее не- неравенство дают Наконец, проинтегрируем по t: • II е(*> IK $ II а (О ! Итак, скорости сходимости по h для задач нелинейной пластич- пластичности и линейной упругости одинаковы.

138 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ Заметим, что вычисление аппроксимации Ритца предпола- предполагалось непрерывным по времени; до сих пор лишь дискретиза- дискретизация заменяла все допустимое пространство ?го подпростран- подпространством Sh. Это соответствует изложению задачи Коши в гл. 7, где ошибки метода" Ритца отделены от ошибок метода конеч- конечных, разностей (или другого метода) по временному направле- направлению. Для нелинейной задачи большие дискуссии вызвал наи- наилучший «метод приращений», но мы полагаем, что все основ- основные возможности сходятся в одном. Они просто вносят новую ошибку, пропорциональную степени приращения At в случае раз- разностного уравнения. Тем не менее в приведенном доказательстве есть одна тех- техническая трудность, игнорировать которую не позволяет нам наша совесть. Это вопрос выбора нормы: если выбрана средне- среднеквадратичная норма, то поточечные оценки для р — ph не верны. С другой стороны, для возможности использования мак- максимальной нормы требуется новое изучение оценки А*-1 для йх — w\. Эта оценка следует из теории среднеквадратичного приближения, и, по-видимому, проще всего вывести ее, а не оценивать поточечно ошибку метода Ритца в статических ли- линейных задачах. Другую возможность дает идея, предложенная Стренгом (последующие приложения см. в [В8]); она позволяет в случае гладкого решения переходить от одной нормы к дру- другой. Такой прием часто бывает незаменим в нелинейных зада- задачах, когда оценки ошибок носят глобальный характер, а не- неустойчивость может возникнуть локально. Третья возможность состоит в улучшении следствия в разд. 4.3, а именно в установ- установлении зависимости от среднеквадратичной нормы возмущения р — ph. Мы уверены в правильности основного доказательства и в том, что сочетание эксперимента и теории скоро приведет к более полному пониманию нелинейных ошибок. В этот краткий обзор теории необходимо включить также задачи на собственные значения и задачи с начальными усло- условиями. Метод конечных элементов успешно применяется непо- непосредственно к обеим задачам. Для самосопряженных задач на собственные значения классический прием — вычисление оце- оценок сверху при минимизации отношения Рэлея на подпростран- подпространстве; он приводит к дискретной задаче на собственные значения KQ = XMQ, где К и М — уже встречавшиеся матрицы жестко- жесткости и массы. В гл. 6 излагается эта дискретная формулировка и оцениваются ошибки в собственных векторах и функциях, за- зависящие от теории приближений: они возникают из-за замены исходного допустимого пространства Ж™ на Sh. Результаты опи- описываются просто: К — %h есть величина порядка /i2(ft-m), а при k ^ 2т порядок ошибок в s-x производных собственных функ-

2.2, СКОРОСТИ СХОДИМОСТИ 139 ций, разрешаемый теорией приближений, не должен превосхо- превосходить hk~s. Для задачи с начальными условиями ut-\-Lu — f положе- положение столь же благоприятное. Решение методом конечных эле- элементов имеет вид uh(t, х)= ? Q/(O<P/(*); временная перемен- переменная остается непрерывной, тогда как зависимость по х дискре- тизируется в терминах обычных кусочно полиномиальных ба- базисных функций ф_,. Коэффициенты Qj(t) определяются из си- системы N обыкновенных дифференциальных уравнений, выра- выражающих метод Галёркина: невязка и^ + Luh — /не обращается тождественно в нуль, если истинное решение и не лежит в про- пространстве пробных функций Sh, но ее компоненты в Sh равны нулю. Таким образом, исходное уравнение удовлетворяется «на подпространстве». В практических задачах время тоже должно быть дискрети- зировано, что предполагает применение метода конечных раз- разностей. Например, схема- Кранка — Николсона симметрична от- относительно ?n+i/2 при вычислении uh(tn+\) через uh(tn) и потому имеет точность порядка At2. Таким образом, окончательно вы- вычисленное приближение содержит эту ошибку, как и ошибку метода Галёркина, вызванную дискретизацией по х. Последнюю из них мы проанализируем подробно и покажем, что при k ^ 2т ее оптимальный порядок для s-й производной тоже ра- равен hh~s. Этот результат применяется к уравнениям параболи- параболического типа, например к уравнению теплопроводности; L — эллиптический оператор того же типа, что и в стационарных задачах. В случае гиперболических уравнений, не содержащих диссипативных членов, возможности метода конечных элемен- элементов несколько меньше; трудности в сравнении с явными раз- разностными методами- могут оказаться слишком большими. Тем не менее даже в этом случае достигнуты значительные резуль- результаты: исследование границ можно проводить почти автомати- автоматически; в гл. 7 включен набросок теории метода конечных элементов для гиперболического случая. За недостатком места изучение изменения области, числен- численного интегрирования и округления ограничено стационарным уравнением Lu = /. Результаты для задачи с начальными усло- условиями и задачи на собственные значения очень похожи; для квадратурных ошибок эти обобщения теории осуществлены Фиксом (Симпозиум по методу конечных элементов в Балтиморе). В последней главе излагаются результаты обширной серии численных экспериментов. Наиболее интересный из них ка- касается задачи с сильными особенностями, порождаемыми тре- трещиной в материале. Эта классическая задача механики разрыва по вычислению коэффициента интенсивности напряжения в

. 140 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ истоке трещины; вокруг этой точки напряжение изменяется по- подобно г~1/2. Итак, возникает целый ряд вопросов: 1. Дадут ли наши оценки ошибок наблюдаемую скорость сходимости — и поточечной, и в среднем квадратичном? 2. Особенность понижает гладкость решения и и, следова- следовательно, скорость сходимости; достаточна ли эта уменьшенная скорость в случае гладкого решения, когда особенности заве- заведомо искажают расчет? 3. Можно ли выбором сетки или введением специальных пробных функций в особенностях восстановить нормальную скорость сходимости метода? ¦ Ответ на каждый вопрос утвердителен и численные резуль- результаты очень убедительны. Как для стационарной задачи, так и для задачи на собственные значения замечательным сред- средством против особенностей, вносимых острыми углами в обла- области, служит введение пробных функций, правильно отражающих свойства особенностей. Задача непосредственного касания материалов мало отли- отличается от предыдущих. Производные от и имеют скачок в месте соприкосновения, и мы настоятельно- рекомендуем следующее простое решение: ослабить требование непрерывности, налагае- налагаемое на производные-от пробных функций, чтобы функция uh могла повторить особенность в и. Мы не верим, что при нор- нормальных обстоятельствах условие скачка (или любое другое естественное краевое условие) следует налагать. Наконец, мы решили теоретически обосновать сравнительно новый технический прием — алгоритм Петерса — Уилкинсона для матричной задачи на .собственные значения Кх = ХМх. Ко- Конечно, решение линейной системы KQ = F представляет собой еще более фундаментальную проблему — это тема для больших усовершенствований в упорядочении неизвестных или в выборе градиентной процедуры, но она сравнительно хорошо изучена. Задача на собственные значения сложнее и без эффективного алгоритма число неизвестных будет недостаточно — оно будет меньше числа, необходимого для выявления физических свойств задачи. Поэтому в гл: 6 мы излагаем идею Петерса — Уилкин- Уилкинсона (как и некоторые более укоренившиеся алгоритмы), а в гл. 8 применяем ее к численным экспериментам. 2.3. МЕТОД ГАЛЁРКИНА, КОЛЛОКАЦИЯ И СМЕШАННЫЙ МЕТОД Описанный метод Ритца применяется только к задачам клас- классического вариационного типа, в которых минимизируется вы- выпуклый функционал. Соответствующее дифференциальное урав- уравнение Эйлера самосопряжено и эллиптично. Однако, хорошо

2.3. МЕТОД ГАЛЁРКИНА, КОЛЛОКАЦИЯ И СМЕШАННЫЙ МЕТОД 141 известно, что уравнения самого общего типа тоже можно запи- записать в слабой форме, допускающей обобщение от метода Ритца к методу Галёркина. Такое применение к задаче с начальными условиями описано в гл. 7. Здесь мы обсудим два типа стацио- стационарных задач: первый, в котором производные нечетного поряд- порядка портят самосопряженность эллиптического уравнения, и вто- второй, в котором соответствующий функционал не положительно определен — тогда проблема состоит в отыскании стационарной точки, а не минимума функционала I(v). Ситуация возникает из принципа Хеллингера — Рейсснера в теории упругости и в со- соответствующем смешанном методе для конечных элементов и приводит к некоторым трудным математическим вопросам при доказательстве сходимости. Сначала остановимся кратко на слабых формах дифферен- дифференциального уравнения Lu = f. Их несколько, но все они обла- обладают основным свойством: уравнение умножается на тестовую функцию v(x) и интегрируется по области Q; в результате полу- получается уравнение (Lu, v) = (f, v). Оно справедливо для каждой функции v из некоторого тесто- тестового пространства V. Все зависит от выбора V. Если V содер- содержит все б-функции, то уравнение Lu = f удовлетворяется в наи- наиболее классическом (можно сказать, старомодном) смысле, т. е. в каждой точке. Дискретная форма это.го тестового про- пространства приводит к методу коллокации, обсуждаемому ниже. Другой крайний случай — пространство V содержит лишь беско- бесконечно гладкие функции, равные нулю в приграничной полосе. Формальное интегрирование по частям переносит все производ- производные с и на v и приводит к уравнению (и, L'v)^(f, v), где V — формально сопряженный к L оператор. В этой слабей- слабейшей форме и удовлетворяет уравнению только «в смысле распре- распределений». Ясно, что изучается дискретная форма. Между этими крайностями заключено очень много возмож- возможностей. Если V = Ж°(п), то говорят, что уравнение выполняется в сильном смысле, а иногда — в смысле L2. Более общий выбор V = 2es(Q) позволяет.перенести s производных с и на v. Если порядок оператора L равен 2т, то решение и, вероятно, надо искать в Ж2™-*. Случай s — m крайне важей, он описывается уравнением а (и, v) = (f, v). Здесь всюду должны играть свою роль краевые условия. В силь- сильной форме (s =0) на и налагается полное множество краевых

142 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ условий; решение должно принадлежать Ж2™. При увеличении s для определения пространства решений понадобятся лишь 2т — s производных от и, так что смысл имеют лишь краевые условия порядка, меньшего 2m — s. Для s = m они являются главными краевыми, условиями1) и и принадлежит Же. В то же время число условий, налагаемых на и, возрастает. Они определяются производными порядка, меньшего s, которые вхо- входят в формулу Грина. Для s = m функция v также принадле- принадлежит Ж'е. Таким образом, в случае метода Ритца существует симметрия между пространством пробных функций и. тестовым пространством. Метод Галёркина представляет собой очевидную дискрети- дискретизацию слабой формы. Вообще говоря, он содержит два семей- семейства функций — подпространство Sh из пространства решений и подпространство Vй из тестового пространства V. Тогда реше- решение Галёркина uh — это такой элемент из Sh, что (Luh, vh) = (f, vh) для всех o'el/' E) В левой части надо s раз проинтегрировать по частям, как и для непрерывной задачи. Если размерности пространств Sh и Vh одинаковы (равны N), уравнение Галёркина обычным образом переходит в операторную форму: если фЬ ..., ф^ — базис про- пространства Sh, a \j>i, ..., tyN — базис пространства Vh, то решение uh = ~EQj(pj удовлетворяет равенству (ZQtLffi, Ч>*) = (f, Ч>*), k=l N. В матричном виде это система GQ=F, Ghj = В методе Ритца Sh=VhczS^E, фу = Ф/ Q — матрица жесткости К. ') С математической точки зрения главное условие Bv = g определяется ограниченным линейным оператором В на пространстве Жт всех функций с конечной энергией деформации. Функции, удовлетворяющие условию Bv = О, образуют замкнутое подпространство. Естественные условия — это те, что не налагаются и не могут налагаться на каждую функцию v, но благодаря спе- специальному виду I(v) они удовлетворяются минимизирующей функцией и. Обычный критерий для главных условий состоит в том, что оператор В дол- должен содержать лишь производные порядка, меньшего т, но это условие ни необходимо, ни достаточно. В двумерной задаче, например при т = 1, нельзя требовать, чтобы функция v равнялась нулю в заданной отдельной точке Р. Значение функции в Я не будет ограниченным функционалом (оно может быть произвольно большим, как lnln г, в то время как функция имеет еди- единичную энергию деформации) и функции, удовлетворяющие условию v(P)=0, не образуют замкнутого подпространства. На самом деле они произвольно близки по энергии деформации к пробным функциям, не равным нулю в Р, и минимизация по ним даст тот же результат, что и минимизация на всем пространстве ЭК1.

2.3. МЕТОД ГАЛЁРКИНА, КОЛЛОКАЦИЯ И СМЕШАННЫЙ МЕТОД 143 Предположим, что Sh — пространство конечных элементов степени k— 1, а V'1 — пространство конечных элементов степени /—1. Тогда можно ожидать, что скорость сходимости s-x про- производных в методе Галёркина будет || u-uh\\s = О (hk-1 + hk+l-*m). F) Как ив D), первый показатель у h отражает наилучший поря- порядок аппроксимации, возможный в Sh, а на второй показатель влияют аппроксимация в тестовом пространстве и порядок 2т дифференциального уравнения. Теоретически возможно до- добиться некоторой экономии, выбирая I <. k, скажем k = 4 (ку- (кубические сплайны) и / = 2 (линейные тестовые функции) в за- задаче второго порядка ([Б29]). Скорость сходимости та же, что и при / = 4, а ширина ленты матрицы G уменьшена. Однако матрица G больше не симметрична даже для самосопряженной задачи; нам это кажется сомнительным. Родственная возможность — «приближенно рассчитать»1) не- некоторые члены в дискретизации и тем самым отклониться от уравнений Ритца KQ = F и KQ = XMQ, используя подпростран- подпространства меньшей степени для членов меньшего порядка в уравне- уравнении. Раньше это применялось в задачах на собственные значе- значения, чтобы заменить плотную матрицу массы М диагональной приближенной матрицей массы. В новейших алгоритмах для за- задачи на собственные значения (гл. 6) не столь важно, чтобы матрица массы была диагональной; по вопросу анализа ошибок процедуры «приближенного расчета» см. [Т9]. В методе коллокации базис тестового пространства Vh со- состоит из б-функций: $j(x)= 6(х — Xj). Поэтому в уравнении Галёркина E) требуется, чтобы дифференциальное уравнение выполнялось в каждом узле: Lu(Xj) = f(Xj). Относительно гра- границ ошибок F) метод действует обычно так, как если бы было / = 0, и скорость сходимости равна hh-2m. Тем не менее сущест- существуют специальные точки коллокации, повышающие порядок схо- сходимости и делающие метод крайне интересным [Д9, Б 31]. Ши- Ширина ленты у G меньше, чем у К., и нет необходимости вычис- вычислять скалярные произведения и матрицы элементов; для более сложных нелинейных задач эти преимущества могут хорошо* скомпенсировать тяжелую аппроксимацию и гладкость, требуе- требуемую от Sh. Задачи, не являющиеся положительно определенными и симме- симметричными Мы хотим подробнее изучить два случая, когда пространство пробных функций Sh совпадает с тестовым пространством Vh 1) В оригинале lump (брать без разбора, смешивать в кучу). — Прим. ред.

144 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ (надо т раз проинтегрировать по частям, так что слабая фор- форма— это по существу уравнение а(и, v) = (f,v) метода Ритца) но задача отличается от классической задачи минимизации по ложительно определенного функционала. Первое отличие — урав- уравнение несамосопряженное, как в примере с постоянными коэф- коэффициентами Lu = — ри" ¦+¦ %и' + qu = f. Сопряженный оператор L* имеет противоположный знак у про- производной нечетного порядка: (- ри" + те' + qu) v = J и (-pv" - то' + qv), что приводит к энергетическому скалярному произведению а (и, v) = \ pu'v' + xu'v -f quv, которое несимметрично: а(и, v)=/='a(v, и). В самом деле, новый член кососопряжен; он соответствует мнимой части оператора L, вещественная часть которого —ри"-\-qu положительна, как и раньше. Это становится особенно ясно, если скалярное произве- произведение расширить на комплексные функции: а (и, v) — \ pu'v' + xu'v + quv. Вещественная часть от а(и,и) равна \p\u'f-\-'q\uf, а новый член чисто мнимый. Мы хотим показать, что можно строго установить, что ско- скорость сходимости производной равна /ift-1 (как и раньше), но для больших т метод конечных элементов может оказаться не- несостоятельным. Доводы довольно общие. Доказательство сходи- сходимости, когда вещественная (самосопряженная) часть эллип- эллиптична, охватывает метод Ритца как частный случай, а метод Галёркина может оказаться неудовлетворительным, если член с нечетной производной (мнимая, или кососопряженная часть) очень велик. Теорема 2.1." Предположим, что \ а (и, v) | ^ КII и \\m|| v \\m и вещественная часть задачи эллиптична: Re а (и, u)^a\\ufm для «е!?, Пусть uh — функция из $к<=.Же, удовлетворяющая уравнению Ритца — Галёркина a(uh, vh) — (f, vh) для всех vh^Sh. Тогда порядок сходимости по энергии (что эквивалентно по- порядку сходимости пг-х производных) равен наилучшему воз- возможному порядку аппроксимации, который можно достичь в Sh: II и - и* II» <4 min||U-yAL. ..G)

2.3. МЕТОД ГАЛЁРКИНА, КОЛЛОКАЦИЯ И СМЕШАННЫЙ МЕТОД 145 В методе конечных элементов для пространства степени k — 1 этот порядок равен hk~m. Доказательство. Так как a(u,v) = (f,v) для всех v из Ж™, то вычитание дает а(и — uh, vh) = О для всех vh. Следова- Следовательно, а||«-1m<(- ) = Rea(M-UA, U) = Rea(U-«A, и - о»)< К\\ и - и* ||м || и - vh \\m. Доказательство завершается делением неравенства на множи- множитель \\и— uh\\m. Теперь можно применить метод Нитше и уста- установить обычную скорость сходимости D) для перемещений. Несмотря на такую сходимость, метод Галёркина на прак- практике может оказаться плохим. Предположим, что Sh — обычное подпространство кусочно линейных функций. Тогда в нашем примере уравнения Галёркина для Qj = vh(xj) будут просто разностными уравнениями -Q/+i +2Q/-Q/-, Q/+i-Q/-i Q/+I+4Q/ + Q/-1 р _ _ + т _ + q^ _ в Заметим, что" первая производная заменяется центральной разностью независимо от знака т. Точное решение, однако, мо- может сильно зависеть от знака т: при |т| -> оо адвективный член ты' доминирует над второй производной, и решение- и есть реше- решение типа пограничного-слоя. На большей части интервала и по существу является решением задачи с начальными условиями, для которой центральная разность совершенно неприемлема, на дальнем конце для удовлетворения другого краевого условия появляются быстрые вариации и нужна особо мелкая сетка. По- Потребность в односторонних (против течения) разностях хорошо известна инженерам-химикам. Математически преобладание т отражается в большом значении К/а в оценке ошибки G). Второе отличие от классической формулировки Ритца возни- возникает, когда функционал потенциальной энергии I(v) не выпук- выпуклый (форма а (и, и) не является положительно определенной) и задача состоит в отыскании не минимума, а стационарной точки. Это, естественно, встречается в смешанном методе, когда и перемещение, и его производные считаются независимыми не- неизвестными. Потенциальная энергия содержит произведения, ко- которые могут быть и положительными, и отрицательными, это похоже на переход от х2 -\- у2 к функции ху, имеющей вместо минимума седловую точку в начале координат.

146 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ Хороший пример дает уравнение aKIV) = f (x), описывающее изгиб нагруженной балки. Будем считать момент М = w" новым неизвестным. Тогда исходное уравнение перейдет в M"=.f, и мы получим систему уравнений второго порядка (. oXJ "(о о)(.)-(,)• <8> Это понижение порядка дает несколько преимуществ. От проб- пробных функций в вариационной формулировке требуется лишь не- непрерывность между элементами, тогда как уравнению четвер- четвертого порядка соответствует потенциальная энергия /(о) = = \ (р"J — 2fv, конечная только тогда, когда наклон v' тоже непрерывен. Более того, число обусловленности матрицы жест- 'кости совершенно изменяется при уменьшении порядка диффе- дифференциальных уравнений: четвертые разности заменяются вто- вторыми, и число обусловленности переходит от O(h~4) к O(h~2). Может показаться чудом, что такое улучшение достигается чисто формальным введением производной М как новой неиз- неизвестной, но это улучшение вполне реальное. Исследуем ошибки округления двумя способами. Рассмо- Рассмотрим свободно опертую балку с и и М, равными нулю на обоих концах. Тогда уравнения М" = / и w" = М можно решить от- отдельно, сначала для М, а затем для хю, применяя для этого либо конечные разности, либо конечные элементы. Предположим, что приближенное решение задачи М" = f содержит ошибку округ- округления 8i, обычно порядка /г~22-(, для ЭВМ с длиной слова t. Тогда приближенное решение задачи w" = —f будет прежде всего содержать свою собственную ошибку округления ег того же порядка и, кроме того, унаследованную ошибку ез. Послед- Последняя удовлетворяет равенству е3' = еь или, скорее, точно удов- удовлетворяет используемой дискретизации этого уравнения, и по- потому порядок ошибки ез также равен h~2. Ошибки округления не объединяются в hrK. В качестве другой проверки вычислим число обусловленно- обусловленности дискретной системы. В случае конечных разностей матрица имеет вид и собственные значения ц этой блочной матрицы связаны с соб- собственными значениями ^.(б2) равенством

2.3. МЕТОД ГАЛЁРКИНА, КОЛЛОКАЦИЯ И СМЕШАННЫЙ МЕТОД 147 Мы знаем, что собственные значения Я оператора второй разно- разности б2 располагаются от 0A) до 0(h~2). Решая квадратное уравнение, получаем ту же область расположения собственных значений ц, и число обусловленности jimax/M-min сдвоенной си- системы действительно имеет порядок hr2. Мы хотим предложить объяснение этого чуда, основанное на нашем наблюдении, что обычное измерение числа обусловлен- обусловленности для этих матриц неестественно. В вычислительных целях мы будем рассматривать эти матрицы как преобразования евклидова пространства (дискретного Ж0) в себя и потому возьмем одну и ту же норму для невязки уравнения и для ре- результирующей ошибки в решении. Это целиком противополож- противоположно тому, что делается в дифференциальной задаче, или тому, что происходит при оценке ошибки дискретизации: f измеряется в норме пространства Ж0, М и ее ошибка — в Ж2, w и ее ошиб- ошибка — в Ж4. (В вариационной задаче соответственно Ж~2, Ж0 и Ж2.) В самом деле, оператор L = d2ldx2 с каким-либо обычным краевым условием вполне обусловлен как преобразование из Ж2 в Ж0. Ограниченность операторов L и L~l была существен- существенным моментом в разд. 1.2. Можно показать, что это верно и для разностного оператора б2, а также для любого приемлемого ана- аналога в методе конечных элементов, если только эти естественные нормы сохраняются. Следовательно, должен быть алгоритм ре- решения уравнения KQ — F, отражающий это свойство, и тогда чудо развеялось бы: ошибки в М и w соответствовали бы их положению. До тех пор пока проводится стандартное исключение, будет разница в ошибках округления для задач четвертого и второго порядков. Прежде чем продолжать далее, приведем сдвоенные диффе- дифференциальные уравнения смешанного метода к вариационной форме. Умножим первое уравнение в (8) на М, второе — на w и проинтегрируем по частям: (w"M + M"w -М2 — 2fw) dx = = - J {2w'Mr -f M2 + 2fw) dx r\-(w'M + M'w) я о В случае свободно опертой балки w и М обращаются в нуль на каждом конце (допустимое пространство удовлетворяет пол- полным условиям Дирихле) и проинтегрированный член исчезает. Для закрепленной балки условие w = 0 налагается на каждом конце, а равенство нулю w' дает естественное краевое условие для М. Если допустимое пространство V содержит все пары (М, w) с функцией М из пространства Неймана Ж1 и функцией

148 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ w из пространства Дирихле Ж1, то стационарная точка функ- функционала / (t) = — J Bxi/Mr + М2 + 2fw) служит в точности, решением задачи о закрепленной балке. Грубо говоря, если на функцию М не наложено никаких усло- условий на концах, а первая вариация от / равна нулю, то множи- множитель w' при М должен равняться нулю. Подчеркнем, что функ- функционал I(v) не имеет определенного знака, как и для принципа упругости Рейсснера; задача состоит в отыскании стационарной точки, а не минимума для I(v). Отметим вычислительные следствия этой вариационной фор- формулировки. Для кусочно линейных элементов и Nh = я функции Mh и wh представимы в виде • ЛГ+1 N Z (так как М свободна на концах, то нужны две дополнительные базисные функции). Теперь неизвестных стало 2N-\-2, но систе- систему нельзя решить последовательно, сначала для Mh, а затем для wh. При N = 2 матрица коэффициентов такова: /-о ву \ D* О/' где 2 1 О О\ / -1 О' 0 0 12/ V О -1 Q — матрица массы (или матрица Грама) функций ф3-, a D — прямоугольная матрица второй разности. Для больших N неиз- неизвестные можно упорядочить 2о, <7ь 2Ь q%, ..., и тогда получается ленточная матрица. Число обусловленности снова равно O(h~2); G заменяется единичной матрицей; собственными значениями служат (j, = 1 (дважды) и корни уравнения ц2 -f- ц = Я,, ' где Я — собственное значение обычной матрицы четвертой разности D*D. Ошибки в Mh и wh будут порядка h2, а в их производных — порядка h. Разумеется, вторая производная от wh не будет равна М\ Для двумерных задач Хеллан и Герман разработали про- простые элементы, подходящие для смешанного метода. Вместо того чтобы описывать эти элементы, мы предпочитаем вернуться к главному с точки зрения математики моменту — к трудности

2.3. МЕТОД ГАЛЁРКИНА, КОЛЛОКАЦИЯ И СМЕШАННЫЙ МЕТОД 149 установления сходимости для неопределенного функционала. Проще всего объяснить задачу в терминах бесконечной симмет- симметричной системы линейных уравнений Lu = b. Предположим, что пространство Sh конечномерно, a Ph — симметричный проектор на Sh, т. е. Phv — компонента вектора v в Sh. Тогда метод Га- лёркина E) равносилен задаче отыскания приближенного ре- решения uh e Sh, удовлетворяющего равенству PhLPhuh = Phb. A0) Оператор PhLPh дискретной задачи, совпадающий с нашей мат- матрицей жесткости К, положительно определен, если таков опера- оператор L; это случай Ритца. На самом деле PhLPh даже более по- положителен, чем L, так как наименьшее собственное значение возрастает при переводе задачи в подпространство. Это оче- очевидно: если jjgS', то (PhLPhv, v) = (LPhv, Phv) = (Lv, v). Пусть оператор L положительно определен на всем простран- пространстве: (Lv, v) ^ a(v, v) для всех v. Тогда эта положительная определенность наследуется оператором PhLPh на подпростран- подпространстве Sh и без убывания- а. Если оператор L симметричен, но неограничен, то таким же, по-видимому, будет и оператор Галёркина PhLPh. (Предпола- (Предполагается, что тестовое пространство Vh и пространство пробных функций Sh совпадают. В противном случае, если Qh — проек- проектор на Vh, то уравнением Галёркина будет QhLPhuh = Qhf, а опе- оператор QhLP\ даже не симметричен.) Естественно ожидать, что uh с увеличением размерности пространства Sh будет прибли- приближаться к и. Тем не менее эта сходимость не автоматическая; в подтверждение правильности гипотезы вернемся к основной теореме численного анализа: согласованность и устойчивость влекут сходимость. Теорема 2.2. Предположим, что метод Галёркина а) согласован, т. е. \\v — Phv\\->0 для каждой функции v, и б) устойчив, т. е. дискретные операторы равномерно обра- обратимы: || {PhLPh) -i|K С. Тогда метод сходится: \\и — «ft||->0. Доказательство. Обозначим (PhLPh)-1 через R, Так как Lu = f, то PhLPhu + PhL (и -Phu) = Phf, или и + RPhL (и - Phi) = RPhf.

160 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ Вычитая uh — RPhf, находим, что \\и-ин 11 = 11 RPhL(u-Phu)\\^C\\L\\\\u-Phu\\^O. Заметим, что скорость сходимости зависит и от константы устойчивости С, и от аппроксимирующих свойств подпростран- подпространства Sh, как и в теореме 2.1. (Полезен особый случай предло- предложенной теоремы для С= 1/а и \\Ь\\= К. Более общие резуль- результаты получены Бабушкой [Б 5].) Можно расширить теорию и доказать также необходимость согласованности и устойчивости для сходимости, а существование решения и предполагать вовсе не обязательно. Браудер и Петришин показали, как вывести об- обратимость исходного оператора L. Снова обращаем внимание на специальную роль положи- положительной определенности: она делает устойчивость автоматиче- автоматической. Вот почему метод Ритца так надежен. В случае неограни- неограниченности оператора L предположим, что подпространство Sh образовано первыми N координатными направлениями; Phv за- задается первыми N компонентами вектора v. Тогда PhLPh пред- представляет собой N-w. главный минор матрицы L (подматрица^в ее верхнем левом углу), а устойчивость означает, что эти (NX N)-подматрицы равномерно обратимы. Похоже, что их обратимость следует из обратимости всей матрицы L, но это не- неверно. Хорошим примером служит обратимая матрица о / для каждого нечетного числа N ведущий главный минор вырож- вырожден. Его последняя строка состоит из нулей, и для / = A,1/2, 1/4, ...) функционал (Lv, v}—2(f, v) на подпространстве Sh не имеет седловой (стационарной) точки. (Мы признательны Мак- карти за его помощь нам в этих вопросах.) Даже в случае 2X2 неопределенная квадратичная функция 2ху совершенно исчезает на подпространстве х = 0. Заметим, что перенумерация неизвестных приводит к матри- матрице L = 1 О очень близкой к сдвоенной системе в примере смешанного метода. Мы ожидали сходимость в этом примере, но она действительно подтверждается только при подходящем выборе подпространств Sh. По-видимому, конструкция конечных элементов дает такой выбор. Джонсон продолжил доказатель-

2.4. СИСТЕМЫ УРАВНЕНИЙ 161 ство сходимости для двух наиболее важных смешанных элемен- элементов, в которых моменты соответственно постоянны и линейны в каждом треугольнике. Его доказательство устанавливает по- после исключения неизвестных перемещений и определения неиз- неизвестных моментов как функций, минимизирующих положитель- положительно определенное выражение (дополнительную энергию), особое свойство. Это свойство совпадает с известным условием Ритца: пробные моменты в дискретном случае содержатся в простран- пространстве допустимых моментов (тех, которые достигают равновесия для предписанной нагрузки) полной непрерывной задачи. Поэто- Поэтому, как и в методе Ритца, сходимость основана на теории при- приближений и ее можно доказать. Для других смешанных (и гиб- гибридных.) элементов естественное доказательство проверяется из согласованности (или аппроксимируемости) и устойчивости. Тогда общая теорема Бабушки [Б5] дает сходимость. Бреззи доказал устойчивость для одного гибридного элемента, и его прием распространяется на общую теорию. Для достижения численной устойчивости в смешанном ме- методе, где матрица коэффициентов не ограничена, в ходе исклю- исключения Гаусса необходимо разрешить выбор главного элемента (перестановку строк и столбцов). Вычислительные результаты подтверждают предсказанное убывание числа обусловленности и ошибок округления, хотя Коннор и Уилл представили неудо- неудовлетворительные результаты для элементов высокой степени: смешанный метод обладает переменным успехом. Тем не менее понижение порядка — настолько ценное свойство, что стоит про- продолжать развивать эту идею. 2.4. СИСТЕМЫ УРАВНЕНИЙ; ЗАДАЧИ ОБ ОБОЛОЧКАХ; ВАРИАНТЫ МЕТОДА КОНЕЧНЫХ ЭЛЕМЕНТОВ Можно возражать против tofo, что в нашей теории метода конечных элементов рассматриваются отдельные неизвестные, в то время как большинство приложений содержат системы г уравнений для вектора неизвестных и= (щ, ..., иг). К сча- счастью, разница часто несущественна. Вариационный принцип для системы также состоит в минимизации квадратичного функцио- функционала I(v), а оценки ошибок зависят, как и раньше, лишь от ап- аппроксимирующих свойств пространств Sh. Типичный пример дают двумерная и трехмерная задачи упругости. В каждой точке неизвестны перемещения по коорди- координатным направлениям, а решение uh метода конечных элемен- элементов— вновь пробная функция, ближайшая к исходному решению в смысле энергии деформации, представляющей собой квадра- квадратичную функцию, содержащую все неизвестные. С помощью

152 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ теории приближений в следующей главе будет показано, что независимо от размерности и количества неизвестных, скорость сходимости связана со степенью конечных элементов и с аппрок- аппроксимацией области. Для оболочек возникают некоторые новые и более трудные задачи. Теория оболочек обычно строится как предельный слу- случай трехмерной задачи упругости, когда область Q становится очень тонкой в одном направлении (в направлении нормали к поверхности оболочки). В результате предельного перехода в функционал потенциальной энергии вводится вторая производ- производная от поперечного перемещения w. Поэтому дифференциальные уравнения имеют четвертый порядок по w и второй порядок по перемещениям в плоскости. Эта диспропорция служит платой за снижение трехмерной задачи до двумерной. Отметим сразу возрастающую популярность трехмерных эле- элементов, для которых такая редукция не проделывается. Из пре- предельной „процедуры, управляющей поиском точного решения задач со специальными свойствами симметрии (как в теории оболочек), автоматически не следует, что тот же процесс упро- упростит численное решение более общих задач. (Этот вопрос воз- возникает для функций напряжений Эйри при изгибе пластины: чувствительны ли они с вычислительной точки зрения к пони- понижению количества неизвестных и возрастанию порядка урав- уравнений? Мы в этом сомневаемся.) Очевидно, что тонкая оболочка никогда не будет отражать типичную трехмерную задачу, так как всегда появятся трудности с областями, близкими к вы- вырожденным. Экспериментально испытывался не только изопара- метрический прием, но и специальный выбор узловых неизвест- неизвестных и сокращенных формул интегрирования в направлении нор- нормали. С теоретической точки зрения необходимо оценить эффект малого параметра толщины t (Фрид сделал это относительно численной устойчивости и числа обусловленности), но в общем аппроксимационный теоретический подход можно применить обычным образом. Существует также целый ряд элементов для криволинейных оболочек в случае двух независимых переменных, к которым наша теория применима непосредственно — даже если они содержат производные разных порядков. Эти элементы по- построены на основе полностью согласованной теории оболочек: поверхность оболочки описывается параметрически набором трех уравнений ** — **@1, 0г), где 0i и 02 — независимые пере- переменные в уравнениях оболочки, которые меняются по обычной плоской области Q. Кривизна оболочки проявляется только че- через производные от хи входящие как переменные коэффициенты в дифференциальные уравнения. Почти обязательно для вычис- вычисления матриц жесткости элементов потребуется численное инте-

2.4. СИСТЕМЫ УРАВНЕНИЙ 153 грирование, но по своей сути задача подобна любой другой задаче на плоскости. Купер и Линдберг построили согласован- согласованные элементы высокой точности (CURSHL [К12]), комбинируя редуцированные в 9" полиномы пятой степени и полные кубиче- кубические функции класса 930 из разд. 1.9 для нормальных переме- перемещений и перемещений в плоскости соответственно. Так как раз- разность k — т для всех компонент равна 3, то скорость сходимо- сходимости в энергии деформации будет h6. Такая конструкция, точность которой подтверждена числен- численными экспериментами, должна была бы прекратить поиск хоро- хороших элементов для оболочек, но такой конструкции нет. Для большинства приложений и программ элементы CURSHL очень сложны и не приняты широко. С одной стороны, есть много задач со специальными свойствами симметрии, в которых при- применимы цилиндрические или тонкие элементы оболочек [07]. С другой стороны, можно аппроксимировать оболочку общего вида объединением плоских частей. Каждая из этих частей действительно становится простым элементом пластины, а де- деформации изгиба и растяжения объединяются только сборкой этих пластин. Один из вариантов этого подхода (неизбежно со- содержащий элементы, несогласованные с точки зрения чистой теории оболочек), по-видимому, считается наиболее простым и практически пригодным способом работы со сложными обо- оболочками. Мы бы очень хотели проанализировать сходимость (или ее отсутствие) этих комбинаций плоско-пластинчатых элементов. Предполагается, что в разумных условиях деформация обо- оболочки многогранника-(такого, как геодезический купол) при- приближает деформацию истинной криволинейной оболочки, но мы не в состоянии подтвердить эту догадку. Математические про- проблемы не изведаны и чрезвычайно интересны. В одномерном случае, когда криволинейная дуга заменяется полиномиальной конструкцией, все выглядит проще. Энергия деформации для дуги является суммой энергий изгиба и растя- растяжения, и ее можно нормализовать: a(v, v) = C]{ + ) +^ Здесь г — радиус кривизны, t — толщина, а условием допусти- допустимости служит принадлежность V\ и v2 классам Шх и Ж1 соот- соответственно; первая производная dv2/ds представляет собой вра- вращение вектора нормалик дуге, и ей непозволительно иметь раз: рывный скачок. Пара v\ = и и v2 = w, минимизирующая потен- потенциальную энергию [I(v) = a (v, v) + линейные члены], представ- представляет собой перемещения дуги по касательной и по нормали. За-

154 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ метим, что они определяются из дифференциальных уравнений (уравнений Эйлера для /(о)) разных порядков. Для аппроксимирующей конструкции (собранной из отрезков прямых) радиус кривизны г становится бесконечным. Это разъ- разъединяет две компоненты вектора v в энергии деформации и, сле- следовательно, приводит к простым и независимым дифференциаль- дифференциальным уравнениям для и и.до. Объединение происходит тем не ме- менее для предотвращения разрыва конструкции в деформирован- деформированном состоянии. Другими словами, каждая пробная функция v = (vu V2) при подходе s слева и справа к s0 должна передви- передвинуть шарнир в одно и то же место и, таким образом, конструк- конструкция остается непрерывной. Это соответствует двум условиям, связывающим обе компоненты векторов о_ и v+ с шарнирным углом 0. (Условия главные, а не естественные.) Кроме того, есть главное условие непрерывности • вращения dvjds, сохра- сохраняющее угол в каждом шарнире. (Заметим, что функция v2 не обязательно непрерывна и может содержать в шарнирах б-функ- ции, у которых производные и слева, и справа равны нулю.) Эти условия вынуждают полиномы в методе конечных эле- элементов сочленяться в узлах. Для о2 типичны модифицированные эрмитовы кубические полиномы: непрерывность вращения остается неизменной, а функция может терпеть разрыв, связан- связанный с разрывом v\. Очевидно, что для задачи о дуге такие проб- пробные функции неприемлемы, а так как энергия деформации тоже изменяется при отбрасывании г, то вопрос о сходимости остается открытым. Для случая дуги окружности и правильного много- многоугольника отсутствие сходимости было доказано.Вальцем, Фул-, тоном и Цирусом (Вторая Райт-Паттерсонская конференция). Уравнения -метода конечных элементов оказались просто раз- разностными, но согласованными с неверным дифференциальным уравнением. Главные члены были правильными (радиус кри- кривизны проявился через угол 0 в условии непрерывности рамки), но для отдельно избранного элемента появились также нежела- нежелательные члены нулевого порядка по hx). Это наводит на мысль о возможности' условия сходимости, похожего на кусочное те- тестирование разд. 4.2. Задачи для оболочек неизбежно сложнее. Даже для много- многогранников, построенных из плоских пластин, условия непрерыв- непрерывности трудно наложить на полиномиальные элементы. Непре- Непрерывность производных всегда труднее достичь для полиномов ') Эти нежелательные члены сравнимы, однако, с другими, появляющи- появляющимися в связи с уравнениями дуги в полной двумерной теории упругости. Та- Таким образом, главные члены во всех теориях, содержащих приближение мно- многоугольником, могут совпадать. То же самое можно сказать об оболочках.

2.4. СИСТЕМЫ УРАВНЕНИЙ 155 степени, меньшей 5. Одну полезную, но математически туман- туманную аппроксимацию дает дискретная гипотеза Кирхгофа: вра- вращения (скорости изменения нормального перемещения в двух координатных направлениях на оболочке) выбираются независи- независимыми переменными, а их истинное отношение к нормальному перемещению налагается только как ограничение в узлах, а не на всей поверхности. Аппроксимации такого типа имеют практи- практическую ценность: слишком много разновидностей задач об обо- оболочках и слишком велик выбор элементов, чтобы решить, что данный конкретный подход лучше других. Даже согласованные элементы, такие, как CURSHL, обладают недостатками из-за того, что движение твердого тела не воспроизводится точно. До- Довод таков: высокие сооружения, наклоняющиеся при ветре, мо- могут допускать такие большие перемещения и как следствие та- такие большие ошибки конечных элементов, что затемняется вну- внутренний изгиб, имеющий первостепенное значение. Мы склонны доверять точности и больше заботиться об удобствах элементов высокой степени. Очевидно, задачи об оболочках поставляют методу конечных элементов очень мощный тест — из всех линейных задач, пожа- пожалуй, самый мощный. То же верно и для математического ана- анализа. Но есть задачи, которые были действительно недоступны более ранней технике, и мы верим, что находимся на пути к их пониманию. Кроме систем уравнений, есть еще одно большое упущение в описанной нами теории метода конечных элементов: мы рас- рассматривали только метод перемещений, в котором перемещение задается в виде ? <7/Ф/, а оптимальные коэффициенты Qj опре- определяются из принципа Ритца — Галёркина. Когда была установ- установлена вычислительная эффективность этого метода, настал пе- период совершенствования элементов и автоматизации ввода-вы- ввода-вывода данных и требуется быстрое развитие машинной графики для обеспечения понятного вывода информации. Остались, од- однако, некоторые несовершенства, от которых можно избавиться только изменением самого математического метода. В этом раз- разделе мы хотим описать некоторые изчПредложенных изменений, еще лежащих в рамках метода взвешенных невязок. Это озна- означает, что приближенное решение по-прежнему будет комбина- комбинацией пробных функций, но способ выбора коэффициентов qj среди возможных может быть другим, либо могут измениться сами неизвестные. Наиболее важный вариант — метод сил, в котором в качестве неизвестных берутся напряжения — производные от и, а не сама функция и. Во многих задачах они играют первостепенную роль, и естественно приближать прямо их. Результат совершенно от-

156 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ личается от результата, полученного при использовании смешан- смешанного метода, в котором неизвестны как перемещения, так и на- напряжения, а функционал неограничен. Здесь минимизируется функционал дополнительной энергии и, не считая изменения до- допустимых условий (на пробные функции наложены новые огра- ограничения между элементами и на границе), математическое со- содержание остается прежним. Порядок аппроксимации, достигае- достигаемый в подпространстве пробных функций, остается решающим. Рассмотрим в качестве примера уравнение Лапласа Ды = 0 в Q, u = g на Г, в котором и определяется из условия минимума функционала / (о) = \ \ v2x-+-v2. Для принципа дополнительной энергии эти производные vx = ei и vv = ег взяты как основные зависимые переменные. От пары (еь ег) не требуется более быть градиен- градиентом некоторой функции и. Другими словами, тождество для смешанных производных (ei)y'= (e2)x, или условие совместимо- совместимости, более не налагается. (Отсюда следует, конечно, что, когда приближения е* и е? уже определены, не существует единст- единственного способа интегрирования для отыскания соответствующей функций uh. При точном применении принципа дополнительной энергии оптимальные функции ei и ег будут производными от истинного перемещения и, но при дискретной аппроксимации эта связь между градиентом и перемещением теряется.) В примере с уравнением Лапласа, для того чтобы квадра- квадратичный функционал был конечным, нужно лишь, чтобы пробные функции для ei и ег принадлежали пространству Ж0. Однако есть еще и ограничение равновесия, налагаемое самим диффе- дифференциальным уравнением: ихх-\-иуу — 0 приводит к (ei)* + (e2), = 0. A1) В действительности это означает, что пара (е2,—ei) будет гра- градиентом некоторой функции w : wx = е2 и wy = —еь Дополни- Дополнительный процесс в этом частном случае можно интерпретировать следующим образом: вместо поиска гармонической функции и вычисляется соответствующая функция тока до. Функция w со- сопряжена с и (функция и + iw аналитична). Это делает два описанных принципа очень похожими внутри области Q. На границе, однако, они заметно отличаются: усло- условие Дирихле для и заменяется на условие Неймана для w. Чтобы убедиться в этом, напомним, что вдоль любой кривой функция и и ее функция тока связаны соотношением wn = —us. (Это следует из уравнения Коши — Римана wx = —иу для вер-

2.4. СИСТЕМЫ УРАВНЕНИИ 157 тикальных кривых, из уравнения wy = их для горизонтальных кривых и из их линейной комбинации в общем случае.) Поэтому на границе Г главное условие и = g заменяется на wn = —gs. Как и в любой неоднородной задаче Неймана, это значит, что допустимое пространство не подвергается ограничениям у гра- границы, но функционал / заменяется на Интегрируя по частям последний член, получаем — \ gwsds, так что функцию w можно исключить, заменяя ее производны- производными wx .= 62 и wv = —еь Принцип дополнительной энергии утверждает, что пара (еь ег), минимизирующая /', будет гра- градиентом перемещения и, минимизирующего /. При аппроксимации конечными элементами пробные функ- функции для w должны принадлежать Ж1, чтобы интеграл /' был конечным. Во что это выливается для переменных ei и ег? Во-первых, так как пробные функции для w непрерывны на гра- границах между элементами, то таковы же и их производные по направлению стороны. Поэтому тангенциальная компонента градиента (е2,—ei), являющаяся нормальной компонентой век- вектора (еь ег), должна быть непрерывна. Именно это ограничение вызывает наибольшие трудности при аппроксимации принципа дополнительной энергии. Каждая из функций ei и ег может не быть непрерывной, но непрерывность нормальной компоненты вектора (еь е2) обязательна. Важно вывести это ограничение прямо из условия равнове- равновесия A1), минуя доказательство с помощью функции тока, так как для более общих задач идея функции тока неуместна. Сна- Сначала мы должны придать некоторый смысл уравнению (ei)* + + (ег)у = 0, когда ei и е2 принадлежат лишь Ж0. У них может не быть производных, так что условие нужно понимать в сла- слабом смысле. Умножим его на гладкую функцию z, равную нулю на Г, и проинтегрируем па частям. Надлежащее ограничение тогда дается слабой формой уравнения A1): 1 1 \1 ~?х "^ е2 ~Т) dxdy = Q для всех таких г. Для пробного пространства кусочно полиномиальных функций к этой форме ограничения можно применить теорему Грина, беря каждый раз по одному элементу. После этого исходное условие A1) должно выполняться внутри каждого элемента, а на каждой границе между элементами должно происходить сокращение граничных интегралов, или натяжений, возникаю- возникающих из-за двух соседних областей. Это как раз то сокращение,

158 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ которое требует непрерывность нормальной компоненты вектора (бье2). Публикации по методу дополнительной энергии, по-види- по-видимому, начались с Треффца [Т10], установившего, что метод дает нижнюю границу интеграла энергии. Затем Фридрихе [Ф18] от- открыл, что основополагающая идея, как и в примере для урав- уравнения Лапласа, состоит в применении метода Ритца к сопря- сопряженной задаче и что краевые условия, главные для одной за- задачи, становятся естественными для сопряженной. Ортогональ- Ортогональность допустимых пространств для двух задач была развита Синжем в гиперкруговом методе [19] после его фундаментальной статьи совместно с Прагером [П9]. Комбинация прямых и со- сопряженных принципов приводит как к нижним, так и к верхним границам для .энергии деформации и для перемещения и. Аб- Абстрактное сообщение об этом дали Обэн и Бушар [03], а Вейн- бергер [В7] применил идею к некоторым модельным задачам. Программы были составлены Моутом и Янгом. Метод конечных элементов первоначально применялся (де Вебек [В5]) к напряжениям, т. е. к дополнительному принципу. Сейчас литература по этой теме неисчерпаема '). Условия, наложенные между элементами, всегда вызывают практические трудности, и это приводит к конструкциям метода множителей и гибридного метода. Например, Андерхегген [А9] предложил использовать для задачи четвертого порядка о пла- пластине и обычного метода Ритца минимизации функционала по- потенциальной энергии I(v) кубические полиномы, для которых наклон нормали обычно разрывался между элементами. Нало- Наложение ограничения на непрерывность наклона связывает с краем каждого элемента множитель Лагранжа и заменяет ме- метод Ритца м'етодом минимизации с ограничением. Требуемые изменения в программах очень просты. Однако матрица жест- жесткости становится неопределенной и (из-за неизвестных на сто- сторонах) вычислительное время для кубических функций оказы- оказывается сравнимым с обычным методом жесткости для редуци- редуцированных полиномов пятой степени, предложенных в разд. 1.9. Вторая интересная модификация — гибридный метод, впер- впервые предложенный Пианом и Тонгом [П4, ПЗ]. Они остроумно справились с трудностями, возникающими между элементами, построив семейство аппроксимаций и для поля напряжений внутри каждого элемента, и для перемещений на границах эле- элементов. Поля напряжений удовлетворяют дифференциальному ') Теория метода сил исходит из тех же прииципов и фактически тех же теорем об аппроксимации, которые применяются в этой книге к методу пере- перемещений. Недостаток места не позволяет нам параллельно развивать здесь всю эту теорию.

2.4. СИСТЕМЫ УРАВНЕНИЙ 159 щ уравнению внутри каждого элемента (так что однородный хлу- чай / = 0 гораздо проще), а перемещения, которые задаются независимым множеством кусочно полиномиальных функций, не- непрерывны. Для каждого перемещения модели дополнительная энергия сначала минимизируется отдельно внутри каждого эле- элемента. Это приводит к семейству перемещений vh, определенных теперь не только на границах элементов, но и всей области Q, для которой можно применить метод Ритца. Окончательная гибридная аппроксимация определяется минимизацией по этим vh. Обычно энергия в этом методе лежит между нижней грани- границей, предоставляемой чистым методом Ритца, и верхней грани- границей сопряженного к нему метода и во многих случаях дает аппроксимацию, существенно лучшую любой другой. Мы еще раз вернемся к основному методу Ритца и заново рассмотрим вопрос: можно ли изменить вариационный принцип так, чтобы не было необходимости в главных краевых условиях? Принцип дополнительной энергии дает один из возможных от- ответов, но есть и другие. В самом деле, сейчас известен стандарт- стандартный прием работы с неудовлетворяемыми ограничениями: вве- ввести в минимизируемое выражение штрафную функцию. (Это было главной темой замечательной лекции Куранта [К15]; метод конечных элементов пришел позднее!) Для —Ды = f и и = g на Г функционал I(v) заменяется функционалом Точный минимум на всем допустимом пространстве Жх без ограничений достигается на функции Uh, удовлетворяющей задаче -AUh = f, ChlU*+UH = 0 на Г. Следовательно, если Ch->0, то эти решения Uh сходятся к ре- решению и, равному нулю на границе Г. Теперь в методе Ритца функционал Ih, содержащий штрафной член, минимизируется на всем пространстве Sh без каких-либо краевых ограничений. Предположим, что Sh — пространство кусочно полиномиальных функций, содержащее полные полиномы степени k—1. Кроме того, .существует равновесие между ошибкой и—Uh (из-за не- невыполненных краевых условий и штрафа)и ошибкой Uh — uh, вызванной минимизацией на подпространстве. Этот баланс при- привел Бабушку [Б4] к определению оптимальной зависимости Ch от A: Ch = chl~h. Бабушка дал также строгие оценки ошибок для родствен- родственного метода множителей Лагранжа, в котором вновь пробные функции не подвержены ограничениям на границе. Для уравне-

160 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ ния Пуассона этот метод отыскивает стационарную точку (и(х,у),l(s)) неограниченного функционала F (v, A)= J (о» + vl - 2fv) dxdy - 2 J Л (v - g) ds: a v Множитель Лагранжа пробегает все допустимые функции, опре- определенные на Г, а в истинной стационарной точке он связан с решением равенством К = ди/дп1). Ошибку в стационарной точ- точке (uh, %h) на подпространстве метода конечных элементов легко оценить [Б6]. Главные краевые условия можно также отбросить с помощью совсем другого подхода, имеющего длинную историю: метода наименьших квадратов. Вместо функционала I(v) = (Lv,v) — — 2(f,v) в этом методе минимизируется невязка \\Lw — f\\2. За- Забывая на время о краевых условиях, представим минимизируе- минимизируемый функционал в виде \\Lw-f ||2 = (La;, Lw) - 2 (/, Lw) + (/, /) - = {L*Lw, w)- 2 (L*f,w) + (f,f). Последний член не зависит от w, и потому метод наименьших квадратов на самом деле минимизирует функционал Г = = (L*Lw, w)—2(L*f, w), который является функционалом Ритца для задачи L*Lu = L*f. Эта новая задача автоматически само- самосопряжена, но заметим, что порядок уравнения удвоился. С краевыми условиями метод наименьших квадратов был должным образом проанализирован впервые в недавних рабо- работах Брамбла и Шатца [Б26, Б27]. Рассматривая-в качестве при- примера задачу Дирихле —Au = f в Q и « = g на Г, они ввели функционал /" (tw) = J J (Аю + ff dx dy + ch~3 \ (ш - gf ds. A2) г Множитель h~3 не имеет отношения к степени k подпростран- подпространства- Sh, как было в методе штрафов. Множитель устанавливает естественный баланс между слагаемыми внутри области и на границе. Минимизация функционала /" становится теперь зада- задачей одновременной аппроксимации в Q и на многообразии Г меньшей размерности. 4) Мы верим, что этот метод будет перспективным вариантом стандарт- стандартного метода перемещений, потому что ои направлен непосредственно на про- проблему вычисления решения (или, точнее, его нормальной производной) на границе. Часто иужиа именно эта информация, а определение ее из. прибли- приближенного решения внутри области численно неустойчиво и не вполне удовле- удовлетворительно.

2.4. СИСТЕМЫ УРАВНЕНИЙ 161 Разумно ожидать, что пространство кусочно полиномиаль- полиномиальных функций даст ту же степень аппроксимации на Г, что и в Q. Если .Г — прямая (возьмем простейший случай), то полный полином от х\, ..., хп сводится на Г к полному полиному от краевых переменных s\ sn_i. Мы полагаем, что для криво- криволинейной границы теория приближений настолько же эффек- эффективна: s-я производная от и отличается от своего интерполянта на величину 0(№~8) на Г. Однако если дано только, что в Q можно достичь k-ю степень аппроксимации, то одновременная аппроксимация с коэффициентом h~3 будет гораздо более труд- трудной задачей. Ее решение, найденное Брамблом и Шатцем, пока- показывает, что баланс степеней в A2) абсолютно верен. При усло- условии, что k^4m, их оценка ошибки для решения u?s методом наименьших квадратов оптимальна: \\u-u1sl^ch4\u\\k. A3) Практические трудности в методе наименьших квадратов связаны с повышением порядка дифференциального уравнения с 2т до 4т. Чтобы новый функционал был конечным, пробные функции должны принадлежать пространству Ж2т. Это озна- означает, что условие допустимости представляет собой требование непрерывности всех производных вплоть до порядка 2т— 1, что трудно достижимо. Более того, ширина ленты матрицы К воз- возрастает, а ее число обусловленности по существу возводится в квадрат, переходя от O(h~2m) к O(h~4mI). Поэтому численное решение неминуемо должно сходиться медленнее. Скорость схо- сходимости в Жх будет обычно равна №, где р —меньшее из чисел k—s и 2k — 4m. Наконец, упомянем два технических приема, недавно изобре- изобретенных для задач с однородными дифференциальными уравне- уравнениями, скажем Дм = 0, и неоднородными краевыми условиями. Есть множество важных приложений, когда и и ди/дп интере- интересуют нас только на границе и вычисление решения всюду в Q оказывается неэффективным. Одна из возможностей состоит в отыскании семейства точ- точных решений ф) qpjv для дифференциального уравнения и в выборе комбинации XQ^j. удовлетворяющей возможно ближе краевым условиям. Это означает минимизацию некоторых вы- выражений для граничной ошибки. В методе наименьших квадра- квадратов это приводит к линейному уравнению для Qj. Фокс, Генричи и Молер [ФИ] достигли больших успехов в минимизации ошиб* ки на дискретном множестве граничных точек вместо примене- применения принципа минимакса. Если ф3- — собственные функции диф- 4) Это возражение опровергнуто модификацией Брамбла ъ Нитше. 6 Зак. 287

162 2. КРАТКОЕ ИЗЛОЖЕНИЕ ТЕОРИИ ференциального оператора, то возможны значительные упроще- упрощения в некоторых отношениях; снова серьезные трудности возни- возникают около границы. Ясное и детальное обсуждение этого более классического круга идей можно найти в книгах Михлина [12—14]. Второй способ использования точной информации об одно- однородном уравнений состоит во введении функции Грина и в пре- преобразовании задачи в интегральное уравнение на границе Г. В некоторых первоначальных попытках приближенное решение на Г бралось как кусочно полиномиальная функция, а ее коэф- коэффициент^ определялись коллокацией. Теоретического обоснова- обоснования этой идеи, по-видимому, не существует, но его время на- наступит.

АППРОКСИМАЦИЯ 3.1. ПОТОЧЕЧНАЯ АППРОКСИМАЦИЯ Этот раздел открывает обсуждение вопроса, который с мате- математической точки зрения лежит в основе теории метода конеч- конечных элементов, а именно аппроксимация пространствами S\ Начнем с поточечной аппроксимации, где легко установить спе- специальную роль полиномов. Затем эту модель распространим на пространства [email protected](Q), т. е. на аппроксимации в энергетиче- энергетических нормах, на которых основан метод конечных элементов Ритца — Галёркина. Предположим сначала, что задана гладкая функция и — и(х),. определенная в каждой точке х = {х\, ..., хп) «-мер- «-мерной области Q. Пусть 5 — пространство узловых конечных эле- элементов, натянутое на функции щ{х), ..., фдг(х). Как и в разд. 2.1, это означает, что каждой функции q>j соответствует такой узел Z) и такая производная Dj, что ДФ/(гЛ = бг/. A) Предположим, наконец, что пространство имеет степень k—1, т. е. каждый полином от х\, ..., хп с полной степенью меньше k можно представить в виде комбинации базисных функций ф3- и, следовательно, он принадлежит S. (Например, полная сте- степень полинома Х\Х2 равна 2; его наличие требуется в простран- пространстве степени k—1=2, но не в пространстве первой степени, даже несмотря на то, что он линеен и по х\, и по х2.) Если Р(х) — такой полином и ему соответствует линейная комбина- комбинация Р = ^jpj(pj, то по свойству интерполяции A) весовые коэф- коэффициенты— это как раз узловые значения полинома: Узловые производные Dj должны быть порядка ^ k. Степень пространства S обычно легко вычислить. Для линей- линейной и билинейной аппроксимации степень равна 1 (другими словами, k = 2), для кубической и бикубической k = 4; для редуцированной аппроксимации пятой степени k = 5 и т. д. Исходя из этих предположений, попытаемся вывести порядок аппроксимации, достигаемый пространством S. Вспоминая, что

164 3, АППРОКСИМАЦИЯ область Q разбита на элементарные области ей е2, -.., будем при измерении точности аппроксимации использовать рас- расстояния Лг = diam (ег), /г = тах/гг. Рассматривая последовательность узловых подпространств Sh с параметром /г, мы надеемся установить, что ошибка аппрокси- аппроксимации убывает, как степенная функция от h. Это потребует ¦предположения однородности, которое можно выразить следую- следующим образом: базисные функции у1} однородны порядка q при условии, что существуют такие постоянные св, что для всех h, i и j max\D\Ux)\<ch\Di\~s. B> || Это условие налагается на все производные Da = dla|/' дх1{ ... ... дхУ вплоть до порядка q, т. е. оно выполняется для всех а, для которых |a|== ai + ... +а„ ^ q. Напомним, что \Dj\ — порядок производной, интерполируемой базисной функцией ф? в узле zh,; \Dt\ — 0, если ф^ соответствует значению интерполи- интерполируемой функции v в вершине, |Z)j| = 1, если ф^ соответствует производной vx, vv или vn и т. д. Хороший пример в одномерном случае дают эрмитовы ку- кубические полиномы (k — 4), определяемые на каждом интер- интервале своими значениями и значениями производных на концах. Для единичного интервала две такие базисные функции г|з и и изображены на рис. 1.8. На уменьшенном интервале [0, Л] эти функции принимают вид г|зЛ = г|з (xjh) и a>h = ha>(x/h) соответ- соответственно: дополнительный множитель h вводится в a>h для того, чтобы наклон в начале координат оставался равным 1. Этим объясняется наличие в B) члена /г'2^1, введенного для совпаде- совпадения размерностей обеих частей неравенства. Такие базисные функции однородны вплоть до q = 2, но третьи производные со- содержат б-функцию в узлах, и однородность пропадает. Ситуа- Ситуация типична для конечных элементов: допускается, чтобы в B) ступенчатые функции содержались в производных #-го порядка, но не выше. Поэтому q — параметр, соответствующий гладкости подпространства; Sh содержится в пространстве W1^1 функций с q— 1 непрерывными производными и, что важнее, в простран- пространстве Звч функций с q производными, суммируемыми в среднем квадратичном. Соответствующим условием возможности приме- применения метода Ритца к дифференциальному уравнению порядка 2гп будет просто q~^ m. Условие однородности становится особенно важным для раз- размерности 2 и выше. Обычно его можно записать в виде геомет-

3.1, ПОТОЧЕЧНАЯ АППРОКСИМАЦИЯ 166 рических ограничений на элементарные области ег-. Сначала рассматривается стандартный элемент, скажем правильный тре- треугольник Т с вершинами @,0), A,0), @,1). По отношению к Т базисные функции и их производные вплоть до порядка q должны быть ограничены. Затем преобразованием координат треугольник Т переводится в заданный треугольник е,- и иссле- исследуется якобиан этого преобра- преобразования. В результате получа- получаем, что базис однороден, если при h ->- 0 все углы в триангу- триангуляции превосходят некоторую нижнюю границу 0О. В этом случае нетрудно найти такие постоянные с„, что ^ const (О, А/2) (о,-Л/г) Рис. 3.1. Функция линейного типа на узком треугольнике. "*¦** (sinGo)* * Подчеркнем, что влияние геометрических свойств на ап- аппроксимацию целиком охваты- охватывается этой оценкой. При раз- разбиении на четырехугольники все углы к тому же должны быть строго меньше 180°, что- чтобы избежать вырождение в треугольники. • Отметим ситуацию, в кото- которой эта оценка для cs невер- неверна. Она, безусловно, нарушает- нарушается, если в элементарной обла- области полиномы не определяются однозначно, узловыми парамет- параметрами, т. е. если матрица Н в разд. 1.10, связывающая коэффи- коэффициенты полинома а,- с узловыми параметрами q^, для какой-ни- какой-нибудь конфигурации элементарных областей будет неограничен- неограниченной. Как только такой вырожденный случай выявлялся, его из- избегали в литературе. Опасность наиболее велика, когда область е,- первоначально ограничена кривой, и, чтобы применить одну из стандартных конструкций конечных элементов, ее отобра- отображают в многоугольник. Если якобиан этого преобразования об- обращается в нуль (см., например, разд.3.3), математические свой- свойства конструкции теряются. Легко понять геометрические условия для линейных функций на треугольниках. Пирамида ф^ равна 1 в /-й вершине и 0 в ос- остальных. Между ними всегда |ф^ (х)|^1, поэтому для нулевой производной однородность выполняется: с0 = 1. Рассмотрим про- производную по х на рис. 3.1. Так как qpj(Zj)== 1 и ф3(Р) = 0, на-

166 3. АППРОКСИМАЦИЯ клон функции q)j между этими точками равен Из сравнения этого соотношения с условием однородности B) видно, что постоянная с\ должна быть не меньше 2/tg 0. По- Поэтому, если треугольник может вырождаться в «стрелку», базис не будет однороден. На таких треугольниках линейная интерполяция может при- привести к существенным ошибкам. Возьмем, например, функцию и(х, у) = у2. Ее интерполянт и{ равен нулю в Zj и /г2/4 в двух других узлах (и потому в Р). Следовательно, для производной по х (равной нулю, так как функция и = у2 не зависит от х) может быть серьезная ошибка в интерполяции: д . .. ч й8/4h _ дх \Ц ui)— (A/2)tge — 2tg6 • Эта ошибка в производной равна O(h), только если угол 0 огра- ограничен снизу. Заметим, что и — а7 = О(/г2) независимо от 0; трудности возникают от безразмерного множителя ftmax/^min, вносимого производной. Вырожденных треугольников любого вида избегают также и по другой причине: они могут нарушить численную устойчи- устойчивость метода Ритца, поскольку отражаются на числе обуслов- обусловленности матрицы /С. Поэтому было построено несколько алго- алгоритмов такой триангуляции произвольной области Q, чтобы все углы оставались более 0о «* я/8. Для более общих «-мерных элементов геометрические требования можно выразить в тер- терминах вписанных шаров, а не углов: область et должна содер- содержать шар радиуса не менее v/г,-, где v — фиксированная по- постоянная. Теперь мы готовы к поточечной аппроксимации в узловом методе. Заданная функция и будет приближаться интерполянтом в пространстве S, другими словами, функцией uIt у которой те же узловые параметры, что и у и: «/ (х) = Т, D,u (z,) ф, (х). Предположим, что и имеет k производных в обычном пото- поточечном смысле, и оценим s-e производные от и — ы7. Теорема 3.1. Пусть степень пространства S равна k—1, а базис удовлетворяет условию однородности B). Тогда для s Щ Я max | Dau {x) - DaUi (х) \ < Csh\~s max | rfu (x) |. C)

3.1. ПОТОЧЕЧНАЯ АППРОКСИМАЦИЯ 167 •Доказательство. Выберем произвольную точку х0 в е, и разложим и в ряд Тейлора u(x) = P(x) + R(x), где Р — полином степени k—1, a R— остаточный член. Нам нужна обычная оценка для остаточного члена R и его произ- производных: max | DaR (х) | <Chki~s max |D*u (x) |. D) \a\=s lPl=fe Ее можно доказать, выражая R как интеграл до прямой от Хо ДО X. Интерполянт Ы/ разлагается по линейности в сумму двух интерполянтов () P() Решающий момент здесь — совпадение Pi и Р: любой полином степени k—1 точно воспроизводится его интерполянтом. Имен- Именно здесь полиномы играют особую роль. Другими словами, Р — Р/ совпадает на е, с пробной функцией, у которой все определяющие узловые параметры равны нулю; поэтому Р = Pi на в{. Таким образом, и — ы7 = R — Ri, и осталось оценить лишь производные от Ri: В этой сумме не более d ненулевых членов, так как другие ба- базисные функции на этом элементе равны нулю. Поэтому если D) объединить с условием однородности B), то DaR, (х) | < dChk-\ Dt I max | D*u \ • csh\Di '~s < Следовательно, Ri оценивается так же, как R; отсюда немедлен- немедленно получаем \Da(u-Uj)\ = \Da(R — R,)| < (С + С') hkrsmax |D^u |. Это и есть оценка C). Теорема доказана1). Заметим, что эта оценка полностью локальна; ы7 имитирует свойства и в каждом элементе. Этого нельзя ждать от решения *) Однородность базиса не является необходимым условием для выпол- выполнения теоремы об аппроксимации. Для билинейной и бикубической аппрокси- аппроксимаций на прямоугольниках выбор очень мелкой сетки в одном координатном направлении испортит однородность, но не порядок аппроксимации. Даже для треугольников можно указать более слабое условие (условие Синжа в [19]), а именно наибольший угол должен быть строго меньше я, т. е. второй наименьший угол в каждом треугольнике должен превышать некоторую вели- величину 6о.

168 3, АППРОКСИМАЦИЯ методом конечных элементов uh, так как оно получается мини- минимизацией глобальной функции I(v) —потенциальной энергии на всей области Q. В самом деле, особенность функции и действи- действительно распространяется с помощью uh на всю область — иногда с очедь медленным затуханием. Этот эффект анализируется в гл. 8. Для абстрактного метода конечных элементов справедлива аналогичная теорема об аппроксимации. Мы потратим время на доказательство этой второй теоремы, несмотря на то что они частично совпадают в случае обычного узлового метода на рав- равномерной сетке. Сплайны не охватываются предыдущей теоре- теоремой, потому что им нехватает локального интерполирующего базиса, однако их аппроксимирующие свойства чрезвычайно важны. В самом деле, специальная регулярность математиче- математической структуры допускает более изящный результат. Аппрокси- Аппроксимация на равномерной сетке зависит от наличия пробной функ- функции г|з со следующим замечательным свойством: для любого полинома Р степени, меньшей ft/ -l). E) Такую суперфункцию ф можно найти в пробном подпростран- подпространстве 5 тогда и только тогда, когда его степень равна k—1. Функция г|з будет отличаться от нуля на малом участке эле- элементов. В простейшем одномерном примере пространство Sh состоит из непрерывных кусочно линейных функций. На каждый интер- интервал сетки приходится одно неизвестное (М = 1), а базис поро- порождается функцией-крышкой Фь Другими словами, базисными функциями служат ф^ (х) = Ф, (x/h — /), а степень подпростран- подпространства Sh равна 1. В этом примере в. качестве функции г|з можно взять Фь так как для любого полинома Р(х) = оа+"Р Обе части равенства совпадают в узлах и линейны между ними, поэтому они должны совпадать всюду. То же самое справедливо в двумерном случае для линейных функций на треугольниках, где графиком функции Ф1 = г|з является пирамида, и для били- билинейных функций на прямоугольниках, где график похож на па- пагоду. В этих случаях аппроксимирующая функция ия в приве- приведенной ниже теореме совпадает с интерполянтом, иг. Построение г|з для кубических функций не так тривиально. Для эрмитовых кубических функций в разд. 1.7 были описаны вместе с 5-сплайном Ф\ две порождающие функции. Ни одна из

3.1. ПОТОЧЕЧНАЯ АППРОКСИМАЦИЯ 169 них не удовлетворяет условию E) на г|з вплоть до k = 4. Тем не менее существует кубический сплайн, удовлетворяющий этому условию и отличающийся от нуля на шести интервалах (рис. 3.2). Это комбинация В-сплайна и двух его соседей, а так как каждый сплайн автоматически является эрмитовой кубиче- кубической функцией, то г|з в таком виде подходит также и для супер- функции в пространстве эрмитовых кубических функций. Обра- Обращаем внимание на то, что вовсе не обязательно знать, какова -2 Рис. 3.2. Суперфункция для кубических полиномов. именно функция г|з: важно лишь, что где-то в пробном простран- пространстве лежит функция, отвечающая за аппроксимирующие свой- свойства пространства. Если дано, что существует функция ty(x), равная нулю при \х\~^ри удовлетворяющая тождеству суперфункции, прибли- приблизим заданную функцию и функцией из Sh. Будем называть функцию uQ квазиинтерполянтом, осно- основанным на г|). Он зависит, как и uIt от локальных свойств функ- функции и, но не совсем интерполирует ее в узлах. Преимущество функции Uq состоит в том, что ее можно записать легко и явно, тогда как интерполяция сплайнами требует решения системы уравнений (несколько В-сплайнов отличны от нуля в каждом

170 з. аппроксимация узле). Так как для аппроксимации достаточно лишь некоторой функции из Sh, близкой к и, то мы свободны в выборе ради удобства. Теорема 3.2. Пусть степень пространства Sh абстрактного метода конечных элементов равна k—1, а \р обладает ограни- ограниченными производными вплоть до порядка q. Тогда для любой производной Da порядка \ а | ^ q max |Dau (x) -Dau0 (x) | <cshk~s max \D*u(x)\. F) <<ft II<A Доказательство. Рассуждения почти такие же, как в теореме 3.Ь Разложение Тейлора вблизи начала координат дает и (х) = Р (х) + R (х), где Р — полином степени k — 1, а R — остаточный член. Разбивая uQ в сумму PQ -f- RQ, видим прежде всего, что Pq совпадает с Р: Это есть не что иное, как тождество E) с измененным (множи- (множителем h) масштабом на оси х; другими словами, тождество E) применено к полиному р(х) = P(xh), а затем х заменено на xh. Остаточный член формулы Тейлора оценен в предыдущей теореме; остается оценить RQ: ^a/?Q W = 2/? (/A) ^a [*(|- Для х из куба 0 ^ х{ < h сетки I ?>аЯо (х) I < S С | lh \k max | D*u (x) | Л а 'с', I X | < рА где С — граница для производных от г|з, множитель /г~|а| воз- возникает при дифференцировании Da, а остальное служит верх- верхней гранью для R(lh). Как и в теореме 3.1, существенна ко- конечность суммы: поскольку г|з Ф 0 лишь для |х|^р, то дей- действительно присутствует лишь конечное множество значений /. Итак, мы получили требуемую оценку при |a| = s: | Da (и - uQ) | = | Da (R - RQ) | < cshk~s max | D&u |. Тот же результат получается и для любого другого куба сетки, если разложить функцию и около одной из его вершин.

3.2. СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 171 3.2. СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ - Мы хотим доказать, что при тех же предположениях отно- относительно подпространства Sh (его степень равна k— 1, а базис однороден) для среднеквадратичной нормы возможна такая же степень аппроксимации. Именно вариационный принцип делает естественным и неизбежным работу" с этими-нормами про- пространств Ж": энергия деформации есть не что иное, как инте- интеграл от квадратов производных функции и. Поскольку uh — ближайший к и элемент в этой энергетической норме, то мы будем изучать в основном эту ошибку. Итак, вообще говоря, норма пространства Жш содержит все производные Da порядка |а| ^ т: 1, ..-, Xn) I a I <m 9. 2 dx. Нам понадобится также полунорма |f|m/2, содержащая только производные порядка |а| = т. Она называется полунормой, потому что обладает двумя свойствами нормы |cw| = |c||w| и \v + w\^.\v\-\-\w\, но не является положительно определен- определенной: для настоящей нормы [| v || = 0, только если v = 0, а для этой полунормы \Р\т = 0, где Р — любой полином степени, меньшей т. Очевидно, что || v \fm = | v \20 + | v \2 -f- ... + | v fm. В одном смысле распространение на эти новые нормы по- поточечных результатов совершенно тривиально. Используя ин- терполянт Ui из предыдущего раздела, возведем поточечную ошибку в квадрат и проинтегрируем: если |а| = s, то J I Dau — DaUj Г dx < (mes Q) max | Dau — DauI f < a ' <C2s(mesQ)A2(ft"s) max \D*u(x)\2. lea IPI-ft Таким образом, если k-e производные функции и ограничены, ошибка будет того же порядка hk~s, как и раньше. Это решает вопрос о скорости сходимости для гладких решений. Такая оценка, однако, никогда полностью не соответствует требованиям. Она содержит две совершенно разные нормы, и чтобы получить среднеквадратичную оценку ошибки s-x про- .изводных, мы предположили равномерную ограниченность k-x производных. Мы вправе рассчитывать на более симметричную теорему, в которой употребляются нормы только одного вида. Более того, такое улучшение необходимо для задач с особенно- особенностями. На пластине с разрезом решение и возрастает, только как квадратный корень из расстояния до конца разреза. Функ-

172 з, аппроксимация ция г1'2 даже недифференцируема; поточечная ошибка будет вести себя, как /г1/2 или, возможно, hl/2\nh. Однако решение должно принадлежать Жх. В самом деле, и имеет примерно «полторы производной» в среднеквадратичном смысле: s-я про- производная ведет себя, как rx^s, и для всех s < 3/2 Короче, мы хотели бы доказать, что порядок среднеквадратич- среднеквадратичной ошибки равен примерно /г3/2, а такой результат можно вы- вывести только из теоремы, в которой сделаны предположения о среднеквадратичной дифференцируемости функции и. Теорема 3.3. Пусть степень подпространства Sh равна k— 1, а его базис однороден порядка q. Предположим, что порядок всех производных Dj, связанных с узловыми параметрами, меньше k — п/2. Тогда для любой функции и(х\,...,хп), обла- обладающей k суммируемыми в квадрате производными, и для лю- любой производной Da порядка s s^q \ | Dau (х) - D4 (х) Г dx < CWi №"s) I u \l e. G) Так как интеграл no Q равен сумме интегралов по еи то sI4,q. (8) Замечание 1. Предположение |D3|<fe — п/2 необходимо для того, чтобы определить интерполянт uj. Лемма Соболева (упоминаемая в разд. 1.8) гарантирует, что для функции и{Х{,...,хп), обладающей k суммируемыми в квадрате произ- производными, производная DjU корректно определена в любой точке |ЯФ)<с||и1и. (9) К счастью, предположение |Dj| << k — nj2 выполняется для всех практических конечных элементов, и теорема непосредственно приводит к оценке скорости сходимости метода конечных эле- элементов. Для того чтобы показать более сложный случай, обратимся к аппроксимации кусочно постоянными функциями (& = 1) на плоскости (л = 2). Тогда, например, для функции In In r из разд. 1.8 лемма Соболева не гарантирует, что интерполянт uj имеет смысл: если узел попадет в начало координат, что будет означать In In 0? Тем не менее даже в этом случае подпростран- подпространство Sh обязательно содержит функцию, дающую правильный порядок h аппроксимации метода наименьших квадратов; функ-

3.2. СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 173 цию и можно подходящим образом сгладить, прежде чем ее ин- интерполировать. Такая же конструкция возможна и в общем слу- случае [С8]: если степень подпространства Sh равна k— 1, а его ба- базис однороден, то для любой размерности п где п—сглаженная функция и. Таким образом, каждое про- пространство метода конечных элементов Sh содержит функцию (обычно ии а если необходимо, то пг), аппроксимирующую и с ожидаемым порядком. Оценки для ы7 доказываются намного проще и достаточны для всех практических целей — или были бы такими, если расширить их на дробные производные, как по- потребовалось в примере пластины с разрезом. Это расширение на самом деле непосредственно выводится из теоремы, если вос- воспользоваться теорией «интерполяционных пространств», которую мы опускаем, не желая вдаваться в подробности. Замечание 2. Для доказательства даже более простой теоремы нужна одна вспомогательная лемма. Разложение Тей- Тейлора, на котором основана поточечная аппроксимация, здесь применить нельзя: функция и может иметь достаточно производ- производных для определения ее интерполянта, но не для разложения Тейлора с остаточным членом hh. Следовательно, нам необхо- необходимо привлечь функциональный анализ для построения поли- полинома, настолько же близкого к функции и в среднем квадратич- квадратичном, насколько были близки к и главные члены ряда Тейлора в поточечном смысле. Основной результат (см. работы [15] и [Б21]> таков: для каждого элемента найдется такой полином Ph-i, что остаточный член R = и — Pfe_i удовлетворяет неравен- неравенству а в каждом узле zj На области диаметра hi = 1 неравенство A0а) представляет собой стандартную лемму [15]; A0Ь) следует из A0а) и- нера- неравенства Соболева (9). Далее, указанная степень hi появляется при изменении масштаба независимых переменных так, чтобы сжать область до е*'). Константы сие' зависят от наименьшего угла в бг. Проще всего предположить ограниченность этого угла снизу, что естественно при однородном базисе. ') h( возникает при изменении масштаба k-x производных, а величину А,- дает квадратный корень из объема области е*.

174 з, аппроксимаций Доказательство теоремы. Рассуждения те же, что и в поточечном случае—благодаря этой лемме. Для каждой эле-, ментарной области е,- запишем u = Ph-i+R, где R удовлетво ряет неравенствам A0). Интерполянт их в силу линейности ра- равен сумме двух интерполянтов: Ui = (Pk-i)i + Ri = Pk-i + Rj, так как полином Pft_[ интерполируется точно. Следовательно, и— Ui=R — Ri. Рассмотрим */(*) = ? {D,R) (z,)<f,(x). Не равно нулю лишь конечное число d этих членов. Учитывая однородность базиса и оценку A0Ь), находим, что для любой . производной порядка |а| =s D% (х) | <d^-| Dl \~ш\ и |fe> e< ¦ csh\Dl К Теперь возведем в квадрат, проинтегрируем по е\ и извлечем квадратный корень: Это и есть оценка A0а) для R; правая часть совпадает с пра- правой частью неравенства G). Тем самым доказательство закон- закончено. Технический прием, состоящий в применении неравенств A0) с учетом особой роли полиномов, известен под названием леммы Брамбла — Гилберта. Такая же теорема с аналогичным доказательством справед- справедлива для абстрактного метода конечных элементов на равномер- равномерной сетке (в частности, для сплайнов); снова берем uq вместо ¦и, [С7]. Теория неравенств в частных производных приводит к воп- вопросу об одностороннем приближении. Для стандартных линей- линейных элементов мы уже установили, что при заданной функции и ^ 0 оценки теорем 3.1—3.3 остаются справедливыми, если по- потребовать 0 ^ vh scl и. (Интерполянт vh = ui, конечно, бесполе- бесполезен, так как он не обязательно лежит ниже и.) Заметим, что Дюво и Лионе сумели сформулировать в виде вариационных неравенств несколько важных физических задач (в том числе задач упруго-пластичности), в дифференциальной формулировке приводящих к чрезвычайно неудобным элиптико-гиперболиче- ским системам с неизвестной свободной границей раздела. Мо- ско и Стренг и независимо от них Фальк подтвердили обычную ошибку h2 в энергии для линейной аппроксимации задачи Сен- Венана о кручении, типичной д'ля класса вариационных нера- неравенств, так называемых задач с ограничениями.

3.2, СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 175 Если элементы содержат несколько полиномиальных членов более высокой степени k, то возникает дополнительный вопрос: все ли производные этого порядка нужны в правой части, нера- неравенства G)? Билинейные элементы, например, воспроизводят член кручения ху, и потому кажется излишним включать в оцен- оценку ошибки с№~*\и\2 смешанную производную иху. Этот вопрос решен Брамблом и Гилбертом [Б22]: действительно, достаточно включить в оценку ошибки лишь ихх и ит. Отсюда будут выте- вытекать ценные следствия для теории прямоугольных изопарамет- рических элементов в следующем разделе. Может случиться, что неравенство G) выполняется внутри каждого элемента для производных всех порядков s ^ k. Огра- Ограничение s ^ q в (8) возникает, когда И/ имеет лишь q— 1 про- производных на границах между элементами. Было бы полезно узнать что-нибудь о постоянных Cs в тео- теореме. Они прямо указывают на свойства отдельного элемента: если для одного элемента они больше, чем для другого той же степени, то первый элемент сравнительно неточен; или «жесток». Для кусочно линейной аппроксимации На прямой с равномерно расположенными узлами Х] = jh эти оптимальные постоянные можно вычислить. Две функции представляют особый интерес: первый тригонометрический полином f(x) = sin nx/h, равный нулю в каждой точке сетки, и первый алгебраический полином g(x) = х2, не совпадающий с его линейным интерполянтом. Для функции f и интерполянт, и наилучшее линейное приближение тождественно равны нулю. Поэтому сама функция f будет ошиб- ошибкой, и легко подсчитать, что Из доказательства теоремы 1.3 в разд. 1.6 следует, что эти по- постоянные оптимальны, так как для любой функции и и ее интер- •полянта" Ui I" — Ui\o<-^rh2\u\2, \u — «/!,<— h\u\2. Следовательно, для линейной аппроксимации Со = 1/я2 и d = 1/я. Какая роль отводится функции g(x) = х2? Для каждой фик- фиксированной функции и она дает постоянную, асимптотически правильную при /i->0. В предыдущем случае мы зафиксировали h и нашли наихудшую функцию sin nx/h. Здесь же мы фикси- фиксируем и и ищем пределы .. min | « — ил ]о ,. min I « — vh\\ /11Ч с0 —hm hr7i-:—- и c, = lim j-.—,—'-. A1)

176 з. аппроксимация Минимум берется по всем vh^Sh, т. е. по всем кусочно линей- линейным функциям. Для каждого значения h эти отношения ограни- ограничены величинами 1/я2 и 1/я соответственно и, значит, пределы не могут превышать эти постоянные. Можно ожидать, что они будут меньше, так как фиксированная функция и не может похо- походить сразу на все осциллирующие функции sin nx/h. Эти новые постоянные с0 и сх (если они существуют) кажутся более есте- естественными при оценке улучшения, ожидаемого в практической задаче при измельчении сетки, поскольку здесь фиксировано решение, a h изменяется. Сначала рассмотрим специфическую функцию и = g = х2. На интервале [—1, 1] наилучшие линейные приближения для перемещений и наклонов минимизируют соответственно инте- интегралы 1 1 \ | jc? — а, — а2х |2 dx и \ | 2х — а212 dx. —1 -1 Эти интегралы равны 2 4а, 2al 8 ___1 + 2а2+-^ и ? + 2а2. В обоих случаях а2 = 0, так как наилучшее приближение четной функции на симметричном интервале [—1, 1] тоже четно. Опти- Оптимальное значение а\ есть 1/3, и отношения, образующие с0 и 6\ (на интервале длины h = 2), принимают вид 1-т 22|х2|2 12 V5 '_ 2|х2|2 2 V3 ' Последнее не слишком отличается от 1/я; оно меньше 1/я, как и следовало ожидать. Заметим, что х2— 1/3 представляет собой второй полином Ле- жандра; это ошибка в методе наименьших квадратов при ап- аппроксимации квадратичной функции g(x) = х2 линейными. Она принимает одинаковые значения 2/3 на обоих концах интервала. Это позволяет легко увязать ее с наилучшим приближением для х2 на соседнем интервале 1 ^ х ^ 3. На нем функция ошибки оптимальной аппроксимации имеет вид (х — 2J—1/3, т. е. тот же полином Лежандра, но смещенный вдоль оси х на две еди- единицы. Эта схема сохраняется: на каждом интервале [2п—1, 2п+1] оптимальная функция ошибки х2 — vh есть (х — 2пJ — — 1/3 и функция ошибки периодична с периодом h = 2 (рис. 3.3). Постоянные 1/12 д/5 и 1/2 д/^ одинаковы на любой совокупно- совокупности этих интервалов. Более того, размерность этих постоянных правильна и они не изменяются, если сначала изменить масштаб

3.2. СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 177 независимых переменных так, чтобы перейти к произвольному исходному интервалу [—/г/2, /г/2], а затем сдвинуть начало -ппп- динат в произвольную точку. Ось х на рис. 3.3 масштаби о в нл в отношении /г/2: 1,'а функция ошибки на оси у—в отношении (/г/2J:1. Легко проверить, что отношения инвариантны. При- Причина такой специфичности функции х2 заключается в том, что переход к (х — х0J изменяет ее на линейное выражение 2хх0 — — х\, которое можно выразить через пробные функции. Заметим, \ . А 2/3 1/3 ж2-1/3 (х-г)г-\/Ъ 1 -1/3 Рис. 3.3. Ошибка линейной аппроксимации функции х2. что наилучшее приближение никоим образом не будет линей- линейным интерполянтом: интерполянт дает правильный показатель степени у /г, но слишком большую постоянную. В процедуре Ритца достигается наилучшая постоянная, потому что миними- минимизация осуществляется по всему пространству Sh. Замечательно, что асимптотическая постоянная не зависит от и. Теорема 3.4. Для. произвольной функции и (х) предельные значения отношений при /г->0 те же, что и для специфической функции х2: со= 1/12 <yfb и с, = 1/2 -\/3. Из этой теоремы вытекает, что при /г-»-0 каждая функция ведет себя, как кусочно квадратичная, т. е. функция ошибки после линейной аппроксимации локально подобна функции, изо- изображенной на рис. 3.3. Другими словами, чем пристальней вы смотрите на функцию, тем больше она напоминает вам полином. Это лежит в основе разложений в ряд Тейлора. Поэтому по- постоянная с0 асимптотически правильна при аппроксимации метр-

178 з. аппроксимация дом наименьших квадратов не только для какой-то особой функ- функции и, но для любого ее выбора. Аналогично постоянная с\ асимптотически правильна для ошибки и — uh метода конечных элементов в примере гл. 1 для уравнения второго порядка. Во- Вообще С\ будет решающей постоянной даже в ошибке перемеще- перемещения для и — uh, поскольку функция uh выбрана так, чтобы ми- минимизировать энергию деформации в ошибке. Прием Нитше в теореме 1.5 указывает, что с\ правильнее с0 отражает ошибку перемещения. Теорему 3.4 докажем сначала для гладкой функции и. На каждом интервале длины ft со средней точкой хо и(х) = и(х0) + (х-х0)и'(х0) + (*~*°J и"(*°) + °(ft3)- A2) Наилучшим (в смысле наименьших квадратов) линейным при- приближением для трех первых членов будет 1 (Y\ ,. (у \ I (г Y } II1 (Г \ 4- — I — I У 0> о \ Z / Z Используя, такие линейные функции на каждом подынтервале, мы действительно возвращаемся к квадратичному случаю. Учи- Учитывая ошибку О (ft3), возникающую из остаточного члена в раз- разложении Тейлора, видим, что отношения на каждом интервале все еще удовлетворяют равенствам Возведем в квадрат и просуммируем по всем интервалам, тогда для кусочно линейной функции L, образованной этими кус- кусками /, \u-L\0 = 1 + O(h) „_. А2|"|2 12 V5 " { ' Остается одна трудность: L разрывна в узлах. Линейная ап- аппроксимация / зависит от разложения Тейлора на своем соб- собственном интервале, и нельзя ожидать, что соседние функции соединятся с ней. Расхождение, однако, имеет порядок лишь так что изменив каждый кусок / на O(h3), получим непрерыв- непрерывную функцию L (в норме | 11, изменение дает О (ft2)). После та- такого изменения и равенство A3), и его аналог в норме | |i про- продолжают выполняться для L. Поэтому при ft->0 отношения при- приближаются к постоянным 1/Г2 -\]Ъ и 1/2 -\/3. Ясно, что ни один другой выбор vh в A1) не дает меньшей постоянной, так как

3.2L СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 17Й эти постоянные уже были верны для функции L, образованной из оптимальных / на каждом подынтервале. Таким образом, тео- теорема доказана для случая, когда функция и достаточно гладка, чтобы допустить разложение Тейлора A2). Техника расширения на все функции «е# стандартна. За- Зададим линейный оператор Phs из Ж2 в Ж условием ihs~2Phsu — компонента функции и, ортогональная к 5Л». Два свойства этого оператора уже доказаны: 1. |Ps«|<Cs|u|2 (теорема 3.3 для k = 2). 2. | Psи |s -> cs | и |2 для гладкой функции и (си. предыдущий абзац). Второе свойство для всех и следует из обычного доказательства полноты, не интересного для инженеров и скучного для матема- математиков. Теорема 3.4 доказана. Обращаем внимание (и снова будем это делать), что нули функции х2—1/3 являются специфическими точками. Поскольку это нули полинома Лежандра, они участвуют в гауссовых квад- квадратурах: на интервале \jh,-(j-\- l)h] они переходят в (/4- 1/2 ± ±1/V3)ft- Для целей метода конечных элементов они специ- специфичны еще и по другой причине: в этих точках наилучшее при- приближение для квадратичной функции равно нулю, a. uh абсо- абсолютно точна. (Известно, что в методе коллокации это так; см.. разд. 2.3.) Будем называть их точками перемещения. Есть также точки напряжения, открытые Барлоу, которые еще важнее. Это точки, где производные от функции ошибки равны нулю (точка х ss 0 в нашем простом примере); в разд. 3.4 мы покажем, что ошибки напряжений в этих точках меньше на добавочную сте- степень h. Предыдущая теорема распространяется на любой конечный элемент на n-мерной равномерной сетке и даже на любой при- пример абстрактного метода конечных элементов. Для п перемен- переменных существует несколько производных DP порядка k = |p|, воз- возможно, связанных с разными постоянными в ошибках аппрок- аппроксимации. В самом деле, если х® оказывается в Sh, то соответ- соответствующая постоянная равна нулю. Локально можно считать функцию и разложенной в ряд Тейлора вплоть до члена степени k. Члены степени k—1 точно воспроизводятся пробным подпро- подпространством, и аппроксимация асимптотически зависит лишь от производных D®u порядка k. Это обобщение теоремы 3.4 можно сформулировать, употребляя матрицы Ks вместо числовых по- постоянных cs. Теорема 3.5. Если степень пространства Sh на равномерной сетке равна k^ 1, то существуют такие неотрицательно опреде-

180 з, аппроксимация ленные матрицы Ks, что для любой функции и е Kf\(Dau)(D*u)dx. A4) Sft |al = |f3|=ft act Диагональные элементы Ks можно определить аппроксима- аппроксимацией одночленов и = х^ = х^1 ... х^п, для которых Dpw— по- постоянная, а другие производные Dau порядка k равны нулю. Удобно возвести в квадрат выражения, фигурирующие в тео- теореме 3.4, т. е.Д0 = с2== 1/720 и /C, = cf=l/12. Для двумерной линейной аппроксимации матрицы Ks будут третьего порядка соответственно трем производным д2/дх2, д2/дхду, д2/ду2 порядка k = 2. Для пространств сплайнов произвольной степени k по- постоянные /С?Р вычислены [С7] в терминах чисел Бернулли. Мы a t Рис. 3.4. Две возможные триангуляции. думаем, что для пространств эрмитовых функций они будут такими же. Известны и минимальные постоянные Cs для сплай- сплайнов, если h фиксировано, а функция и меняется (Бабушка). Здесь снова крайний случай представляют синусы с длиной вол- волны 2h, их наилучшие приближения — тождественные нули, а постоянные равны Cs = ns~k. С помощью теоремы 3.5 можно количественно сравнить два различных полиномиальных элемента или два одинаковых эле- элемента с разными геометрическими формами. Рассмотрим две регулярные триангуляции плоскости: одна содержит диагонали в обоих направлениях, другая — только в одном (рис. 3.4). Ком- Комбинационно они совершенно различны. В триангуляции а одни узлы связаны с четырьмя соседними, а другие — с восемью. В б каждый узел имеет шесть соседних. Рассмотрим простран- пространство Куранта Sh непрерывных кусочно линейных функций на этих треугольниках. Так как в триангуляции а вдвое больше узлов, чем в б, то размерность пространства Sa (соответствую- (соответствующего триангуляции а) вдвое больше размерности пространства

3.2, СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 181 Sb (соответствующего триангуляции б). Более того, простран- пространство Sa содержит Sb и потому по крайней мере такое же хоро- хорошее в смысле аппроксимации. Возникает вопрос: вдвое ли оно лучше (компенсация за удвоенное количество параметров)? В двумерном случае три одночлена: х2, ху и у2. Предположим, что для каждого из них мы нашли функцию uh e Sh, минимизи- минимизирующую \и—.uh\i. Эта функция uh и будет решением метода конечных элементов уравнения Пуассона, когда точное решение и есть квадратичная функция. Начнем с функции и = х2 на квадрате со стороной h = 2, симметричном относительно начала координат. Из соображений симметрии значения оптимальной функции uh в четырех верши- вершинах одинаковы и равны, скажем, а в случае а и р в случае б. В центре uh = р в случае б, а в случае a uh может принимать другое значение, скажем y- Это означает, что в б функция uh постоянна на этом квадрате, причем равна р = 1/3, как и ранее в одномерном случае. Ошибка на квадрате сетки есть Она равна h2\ufj\2 и, как в одномерном случае, /Ci1 = 1/12. В конфигурации а минимизация проводится по y. так что по- постоянная должна быть меньше, и окончательно получаем |.-«Ч.-.-?Ц1. ,A5) Так можно сравнить две конфигурации. Размерность в случае а вдвое больше, чем в случае б; другими словами, в а эффектив- эффективнее работать с квадратами со стороной /г/л/2 вместо h в слу- случае б. При такой замене постоянная в A5) становится равной 1/s и конфигурация б лучше, чем а в отношении 12:9. Коэффи- Коэффициент в ошибке при х2 для эквивалентного множества свободных параметров будет меньше в случае b в д/3А Раз- По симметрии это справедливо и для коэффициента при у2. Для члена круче- кручения ху обе конфигурации оказываются одинаково эффективны, и нечего выбирать. Эти подсчеты подтверждаются численными экспериментами, описываемыми в технической литературе, которая отдает пред- предпочтение конфигурации б. Для элементов более высокого по- порядка на ЭВМ смогли вычислить постоянные /Сар, решая мето- методом конечных элементов задачу, истинным решением которой было и =tx$. Одновременно вычисляются главные члены в ошиб- ошибке усечения ряда Тейлора для конечно-разностной схемы, возни- возникающей на равномерной сетке (см. разд. 1.3 и 3.4).

18$ 3, АППРОКСИМАЦИЯ Из теоремы 3.5 вытекает также важный теоретический ре- результат. Следствие. Для достижения аппроксимации порядка hh~~ для s-x производных пробное пространство Sh на равномерной сетке должно быть по крайней мере степени k— 1. Поэтому ме- метод конечных элементов в случае дифференциального уравнения порядка 2т сходится, только если k > m. Это и есть условие постоянной деформации, состоящее в том, что все полиномы сте- степени m должны принадлежать Sh. Это следствие'является обратным к теореме 3.2 на равномер- равномерной сетке. Для его доказательства предположим, что степень пространства Sh равна лишь / — 1(/</г). Пусть ха имеет сте- степень / и не принадлежит Sh. Тогда по теореме 3.4 hs~l min | ха — vh |s -*¦ const ф 0. Следовательно, порядок аппроксимации для ха равен только I — s, а не k — s, и следствие доказано. Ясно, что эта теорема, -ЛОЛ -ЛОЛ Рис. 3.5. Функции неполиномиального типа: а — функция-крышка, б — функция Cos. дающая точное условие сходимости, намного сильнее, чем ее следствие. Первая применяется для всех и, в то время как для последнего необходимо исследовать аппроксимацию полиномов наименьшей степени, не принадлежащих пробному пространству. Вывод довольно интересен: все зависит от присутствия поли- полиномов. Это значит, что кусочно полиномиальные функции яв- являются наилучшими пробными функциями не только из-за их удобства, но также из-за их аппроксимирующих свойств. С са- самого начала метод конечных элементов работал с подпростран- подпространствами оптимального типа. Результат следствия можно доказать непосредственно [С 12]; учитывая его важность, докажем его в простейшем случае. Мы покажем, что для аппроксимации порядка h пробному простран- пространству должна принадлежать постоянная функция 1. Допустим, например, что функция-крышка заменена косинусом (рис. 3.5).

3.2. СРЕДНЕКВАДРАТИЧНОЕ ПРИБЛИЖЕНИЕ 183 Пробное пространство содержит все комбинации vh == ? q{ Cos [я {х ~ /Л)/2Л]; запись Cos означает, что вне центральной дуги |0|^я/2 коси- косинус продолжен нулем. В пределе при h -> О могла бы проявиться какая-нибудь разница по сравнению с кусочно линейной аппро- аппроксимацией. Предположим, однако, что мы пытаемся аппроксимировать функцию и =з 1 на единичном интервале. В линейном случае эта функция принадлежит пробному пространству, а в нашем слу- случае— нет, и функция ошибки Eh периодична с периодом h. За- Забудем о краевых условиях или лучше предположим, что они пе- периодические, поскольку в любом случае они оказывают второ- второстепенное влияние на аппроксимацию внутри интервала. Таким образом, ошибка равна o s" o Этот интеграл охватывает l/h периодов и на каждом из них ра- равен КФ-, где постоянная Ко не зависит от h. Если изменить h, то функция ошибки (как на рис. 3.3) просто будет в новом мас- масштабе в соответствии с новым периодом. Следовательно, ошибка аппроксимации равна постоянной Ко (как и предсказано в тео- теореме 3.5) и не убывает с h. Пространство Косинусов не имеет никаких аппроксимирующих свойств. Конечно, это неблагоприятное заключение не относится к обыкновенным косинусам, которые числятся среди наиболее цен- ценных пробных функций в методе Ритца. В некотором смысле они имеют бесконечную точность, k = оо, поскольку пользуются лю- любой дополнительной степенью гладкости аппроксимируемого ре- решения и. Так как каждый косинус не равен нулю на всем интер- интервале, этот случай не охватывается теорией метода конечных элементов, и условие обязательной для успешной аппроксимации принадлежности полиномов пробному пространству больше не имеет силы. Закончим этот раздел несколькими историческими замеча- замечаниями о случае равномерной сетки, другими словами, о теории аппроксимации в абстрактном методе конечных элементов. Естественно подойти к проблеме, используя преобразование Фурье. Среднеквадратичные нормы \\|Da«| dx можно превра- превратить с помощью формулы Парсеваля в \\||ай| d?, а условие, что функция ф порождает полиномы, дает нули в ее преобразо- преобразовании Фурье. Функция-крышка, например, порождает все линей- линейные полиномы, ее преобразованием будет ф(|) = (sin(|/2)/|/2J

184 3. АППРОКСИМАЦИЯ с нулями порядка k = 2 во всех точках 1= ±2я, ±4я, ... . Для В-сплайнов произвольной степени k— 1 показатель в ф ста- становится просто k; это результат свертки функции-ящика с самой собой &.раз. Связь между полиномами от х степени k— 1 и ну- нулями порядка k в точках | = 2пп была обнаружена Шёнбергом в его первой статье по сплайнам [Ш2] и три раза переоткрыва- переоткрывалась в литературе по методу конечных элементов [Г4], [БЗ], [Ф9]. В статьях [С7, С12] и в книге Обэна [16] основательно изу- изучается анализ Фурье абстрактного метода конечных элементов в «-мерном случае. Сформулированное выше следствие о том, что пространство Sh на равномерной сетке должно иметь степень k—1 для достижения аппроксимации порядка hh, было сначала доказано методом Фурье, причем вместе с существованием су- суперфункции ^, обсуждаемой в разд. 3.1. С большим сожалением мы признаем, что анализ Фурье не сможем изложить подробно; для нас реально лишь выбрать результаты, единственные в своем роде для равномерной сетки и в то же время важные для общей теории: асимптотическая теорема 3.5 и ее"следствие, конечно- разностный аспект системы KQ = F, описанный в разд. 3.4, и обсуждение числа обусловленности в гл. 5. Теперь вернемся к главному результату этого раздела: на элементарной области et разность между функцией и и ее ин- терполянтом Ui удовлетворяет неравенству ' I " — «/ U. в, < СтАГга | и U, в|. A6) Что происходит, если в решении и есть особенность, препятст- препятствующая его принадлежности пространству «3^ft? На равномерной сетке порядок сходимости определенно будет понижен. Если и обладает только г производными, суммируемыми в квадрате, то ошибка в энергии будет убывать, как п2<-г~т\ а не как /i2(ft-m). И поточечная ошибка в напряжениях будет явно хуже. Вопрос заключается в следующем: можно ли достичь какого-нибудь улучшения «градуировкой» сетки, т. е. изменением шага h для измельчения сетки около особенности? Когда неудобно вводить специальные сингулярные пробные функции, существует один полезный кустарный способ, предо- предоставляемый формулой A6): градуировка должна быть такой, чтобы величины h\~m\u\ktei были примерно равны на двух со- соседних элементах. В одномерном случае для особенности х'1 в начале координат это означает, что функция hh~m+'i'Xa-k долж- должна быть примерно постоянной; чем больше х, тем больше может быть h = Ах. Оказывается, что это правило имеет замечательное следствие: подходящей градуировкой сетки можно достичь оди- одинакового порядка точности для сингулярного и для регулярного решений и. Другими словами, пусть для неравномерной я-мер-

3.3. КРИВОЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 186 ной сетки с N элементами средний размер сетки Я вычислен по формуле Nhn = mes Q. Тогда правильная градуировка может дать \и — ui|m, a = О(Hk~m) даже для сингулярной функции и с нормой \u\h, a= °°- 3.3. КРИВОЛИНЕЙНЫЕ ЭЛЕМЕНТЫ И ИЗОПАРАМЕТРИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ Основная идея проста. Предположим, что мы собираемся ис- использовать обычный полиномиальный элемент, например один из тех, что определены на прямоугольниках или треугольниках в разд. 1.8. Предположим также, что области, на которые разби- разбивается Q, неподходящей формы, т. е. могут иметь одну и более криволинейных сторон или быть непрямоугольными четырех- четырехугольниками. Выбирая новую систему координат |, т), можно привести элементы к правильной форме. Матрицы жесткости элементов тогда вычисляются интегрированием в новых пере- переменных на треугольниках или прямоугольниках, а минимизация приводит к решению «л(|, т]) метода конечных элементов, кото- которое можно преобразовать обратно в переменные хну1). Подчеркнем несколько важных моментов. Во-первых, так как типичный интеграл по двумерному элементу преобразуется по формуле \\ Р(х, У) (Ух?dxdy-> то преобразование координат и его производные должны вычис- вычисляться легко. Далее, преобразование координат не должно чрез- чрезмерно искажать элемент, иначе якобиан 1=хъуц— х^у\ может обратиться в нуль внутри области интегрирования; это может произойти удивительно легко. Чрезмерное искажение также раз- разрушит точность, заложенную в полиномиальный элемент. Поли- Полиномы в новых переменных не соответствуют полиномам в старых переменных, и для сохранения теории аппроксимации требуется, чтобы преобразование координат было равномерно гладким. На- Наконец, для того чтобы согласованные элементы в переменных |, т] были согласованными в переменных х, у, должно выполняться глобальное условие непрерывности для преобразования коорди- координат: если энергия содержит т-е производные, то преобразование координат должно быть класса Фт~1 между элементами. Пока ') Изопараметрическая техника так же важна для трехмерного случая. Ее проще продемонстрировать на примерах в плоскости, но теоретически ни- никакой разницы иет.

186 з. аппроксимация мы обсудим только случай т = 1, возникающий из дифферен- дифференциальных уравнений второго порядка, где отображение должно быть непрерывным между элементами: точка, общая для е,- и eh не должна при ег-+Еи ej-+Ej распадаться на две отдельные точки. Как удовлетворить эти условия, особенно требование легкой вычислимости? Изопараметрическая техника состоит в выборе кусочно полиномиальных функций для определения преобразо- преобразования координат jc(|, ц) и уA,ц). Строго говоря, термин изопа- раметрический означает, что для преобразования координат выбираются такие же полиномиальные элементы, как и для са- самих пробных функций; термин субпараметрический означает, что @,1) @,0) sr A,1) -4 9" Рис. З.6. Изопараметрические отображения в четырехугольники. берется подмножество полиномов меньшей степени. В любом случае мы требуем непрерывности между элементами и невы- невырожденности матрицы Якоби. Основной изопараметрический пример состоит в билинейном преобразовании квадрата в четырехугольник (рис. 3.6). Преоб- Преобразование координат из 5 в Q осуществляется по формулам х{1, л) = *1 + («г —*i)I+(*3 —*i) Л + (*4 — *з — *г + *i) 1Л, У (I, Л) = У\ + (& - Уд I + (Уъ - У\) Л + (yt ~ Уз — У2 + Уд Ы каждая сторона квадрата S линейно переходит в соответствую- соответствующую сторону четырехугольника Q. Например, если ц = 0, а | изменяется от 0 до 1, то точка (х, у) движется линейно от од- одного угла (хи Уг) к другому (хг, г/г)- Для этой границы положе- положение Других вершин (х3, уз) и (xit у4) абсолютно безразлично. Это гарантирует согласованность в переменных х и у для любого согласованного элемента в переменных | и ц (скажем, билиней- билинейного или бикубического эрмитова элемента, для которого пре- преобразование изопараметрическое или субпараметрическое соот- соответственно).

3.3. КРИВОЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 187 Надо проверить, что преобразование A8) обратимо, другими словами, что каждая точка (х, у) в Q соответствует одной и только одной паре (?, ц) в S. Разрешая уравнения A8) относи- относительно | и т] через х и у, мы получили бы сложные квадратные корни, и это ничего бы нам не дало. Поэтому, так как уже про- проверено соответствие границ для S и Q, мы только покажем, что внутри S якобиан нигде не обращается в нуль: х2 — хх + Ат\ х3 — хх + А где А '= х4 — х3 — x2'+ x-i, а В = г/4 — Уз— #2 + #i- Якобиан в действительности линеен, а не билинеен, поскольку коэффициент при ?т] в этом B X 2)-определителе равен нулю: АВ — АВ = 0. Следовательно, если J имеет один и тот же знак во всех четырех углах квадрата S, он не может равняться нулю внутри S. В угле 1 = 0, т) = 0 якобиан равен I @, 0) = (*2 — х\) (Уз — Уд — (У2 — У\) (*з — хх), что в свою очередь равно IV sin 9; стороны /, /' и угол 0 между ними изображены на рис. 3.6. Поэтому />0 в этом' угле, если внутренний угол 0 меньше я. Это справедливо и для любого дру- другого угла.- Следовательно, якобиан / всюду отличен от нуля тогда и только тогда* когда четырехугольник Q выпуклый, т. е. все его углы должны быть меньше я. В противном случае, как для Q" на рис. 3.6, / изменит знак где-нибудь внутри S. Тогда преобразование координат будет незаконным. Заметим, что, хотя полиномы от х и у не переходят, вообще говоря, в полиномы от | и т], линейные полиномы 1, х, у пред- представляют исключение. Само преобразование координат выра- выражает х и у как билинейные функции от | и т], и, конечно, по- постоянная функция остается постоянной. Если эти три полинома принадлежат пробному пространству, то выполнение условия сходимости гарантировано, т. е. все решения и = а + Р* + УУ с постоянной деформацией точно воспроизводятся в Sh. Это всегда верно для изопараметрических преобразований и сходи- сходимость обеспечена. Субпараметрический случай еще лучше: если пробное пространство содержит все биквадратичные или бикуби- бикубические функции от | и т], то оно содержит и все биквадратичные или бикубические функции от х и у, a Sh имеет степень 2 или 3 соответственно. Поэтому в предположении, что углы четырех- четырехугольника Q заключены строго между 0 и я, аппроксимация в полной мере возможна, а ошибка в деформациях равна O(ftft-'), как и должно быть. Для треугольников наиболее важен пример треугольника С одной криволинейной стороной, лежащей на границе Г

188 3. АППРОКСИМАЦИЯ (рис. 3.7). Простейшая из возможных кривых — кривая второй степени, и естественный выбор элементов — квадратичные функ- функции. На треугольнике в плоскости ?, т] пробная функция vh = определяется своими значениями в шести узлах фигуры: в трех вершинах и в серединах трех сторон. Представим себе два отображения исходного криволинейного треугольника в плоскости х, у. Сначала простое линейное преоб- преобразование нормализует криволинейный треугольник, переводя две прямые стороны в координатные оси на плоскости х', у'. Рис. 3.7. Отображения криволинейного треугольника. Якобиан этого преобразования постоянен, так что этот шаг пред- предпринимается для удобства. А вот следующий шаг важен: надо связать координаты х', у' с |, ц так, чтобы заданная граничная точка (X', Y') переходила в среднюю точку A/2, 7г). На прак- практике (X, Y) и, следовательно, (X', Y') часто выбираются на се- середине дуги, но это необязательно. Отображение билинейно: A9) Легко проверить, .что прямые стороны сохраняются и непрерыв- непрерывность при переходе в соседние элементы обеспечивается. Яко- Якобиан имеет вид 1+DГ-2)т] DГ — 2) г) DГ-2Ц 1 + DГ - 2) % Снова он линеен; он равен 1 при 1=0, т) = 0 и всюду в тре- треугольнике отличен от нуля тогда и только тогда, когда он поло-

3.3. КРИВОЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 189 жителей в двух других вершинах. Это условие, впервые выска- высказанное нам Митчеллом, есть просто 4Z'-2>-l, или *'>1/4, в точке @,1), 4Г-2>-1, или Г>1/4, в точке A,0). Следовательно, (X', Y') может лежать где-нибудь в квадранте, образованном штриховыми линиями, и тогда (X, Y) — в отмечен- отмеченном секторе (рис. 3.7). Заметим, что даже для исходного тре- треугольника с прямыми сторонами точка (X, Y) должна лежать в средней части ее стороны, иначе сдвиг ее внутрь может при- привести к обращению якобиана в нуль. (Конечно, в этом случае нет причин ее сдвигать: на треугольнике с прямыми сторонами можно было бы взять квадратичные элементы в переменных х, у даже с произвольно расположенными средними узлами. Ото- Отображение в плоскость |, т] действительно предназначается для случая, когда надо выпрямить криволинейные стороны.) В этом примере криволинейная сторона была параболой. В общем изопараметрическом случае как с треугольниками, так и с прямоугольниками отображения х(%, ц), у{%, ц) задаются тем же типом полиномиальных элементов, что и для перемещений, а все стороны могут быть полиномами степени k— 1. Ограничения те же, что и на сами элементы, т. е. когда неизвестные содержат несколько производных в узле, это означает, что соответствую^ щие производные граничных кривых должны быть непрерывны в узлах. Случай Лагранжа поэтому будет простейшим для изо- , параметрических преобразований,, так как неизвестны только значения функции, а единственное ограничение — непрерывность между элементами, необходимая в любом случае. В самом деле, все особенно просто, если, как в сирендиповом прямоугольном элементе на рис. 3.8, нет внутренних узлов. Отображение между границами тогда полностью определяет преобразование коорди- координат, которое в противном случае очень чувствительно к пере- передвижению внутренних узлов. Подчеркнем, что вся изопарлметрическая техника основана на применении численного интегрирования (в переменных |, ц) для вычисления элементов матриц К и F. Из выбора перемен- переменных в интеграле A7) по элементарной области видно, что даже для изотропного материала (р = const) математический экви- эквивалент переменных свойств материала выражается функциями |ж, i\y и /(|, л). Вообще говоря, две первые функции рацио- рациональны, а последняя — полином, гладкость которого зависит от искажения элементарной области. В разд. 4.3 мы установим влияние ошибок численного интегрирования на окончательный результат и требуемый порядок точности.

190 з. аппроксимация Здесь мы рассматриваем вопрос агшроксимации: насколько можно приблизить изопараметрическими элементами истинное решение и(х,у)? Ответ должен зависеть от величины производ- производных в преобразовании координат F: Пусть й(|, т]) обозначает решение и(х,у), преобразованное к но- новым координатам. Тогда если степень . пространства Sh равна Рис. 3.8. ^ Обычные изопараметрические элементы. k—1 в переменных % и ц, то интерполянт uj удовлетворяет не- неравенству |a) ^ 5p. B0) При замене на переменные х, у каждая производная от й пере- переходит в сумму: ¦щй-+ ихх% + u их Вообще производная порядка |р| ^ k должна быть ограничена: |ЯРЙ(?,ЛI<11Л1* Z \D4(x,y)\, ivi-i где постоянная II^IU вычисляется из степеней производных #?, Ух, хц, ... внутри элементарных областей вплоть до порядка k. Сиарле и Равьяр [С5], рассуждения которых мы излагаем далее,

3.3. КРИВОЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 191 подробно расписывают это выражение. Обратная величина яко- якобиана / также входит в преобразование интеграла: Неравенство справедливо для всех |C| ^ k, так что Это дает верхнюю границу для правой части в B0). Для левой части нужна нижняя граница; поэтому обратим рассуждения, которые привели нас к B1): IlIE||!U-U/ie,B. . B2) На этот раз множитель ilf-'lls зависит от степеней производных вплоть до порядка s обратного отображения F~l, переводящего переменные х, у в |, ц. Если якобиан / не равен нулю, как мы предположили, то производные от F-1 можно выразить через производные от F. Для первых производных справедливо тож- тождество матриц Якоби f Чу- Для производных более высокого порядка это тождество диф- дифференцируют, и основной вопрос снова состоит в оценке произ- производных от F. Подытожим результаты. Подстановка B1) и B2) превра- превращает исходное неравенство \\u — UJ\\s^.Ch'i~s\\u\\k.Ha элемен- элементарной области Е{ в аналогичное неравенство на ей -8\\и\,е^ B3) где Это основной результат. Порядок аппроксимации для изопа- раметрических функций тот же, что и для обычных полиномов, при условии, что постоянная С остается ограниченной. Заметим, что hi — диаметр элементарной области на плоскости |, ц, даже хотя аппроксимационное неравенство B3) выполняется для пе-

192 3. АППРОКСИМАЦИЯ ременных х, у. Можно, однако, предположить, что диаметры одинаковы в этих двух системах координат. (Изменение мас- масштаба для |, т) не меняет неравенство, как и должно быть: если hi переходит в ah{, то нормы для F и F~] умножаются на a~h и as соответственно.) Эта'нормализация удобна, поскольку для равных диаметров задача изопараметрической аппроксимации сводится как раз к оценке функции F и ее производных и к во- вопросу о необращении в нуль якобиана /, равномерно при h-*-0. Для четырехугольников существует важная модификация. Она необходима даже для преобразования, определяемого ра- равенствами Это преобразование переводит три точки @,0), (h, 0) и @, h) в них самих, а четвертый угол квадрата переходит в новую точку (h, /г/2). Другими словами, это совершенно типичное отображе- отображение, преобразующее квадрат на плоскости |, ц в четырехуголь- четырехугольник, сравнимый с ним формой и размерами. Тем не менее сме- смешанная производная г/?т], входящая в норму \\F\\k в аппрокси- мационном неравенстве, имеет порядок 1/Л. Это нарушит поря- порядок аппроксимации. Сиарле и Равьяру удалось, однако, восполь- воспользоваться присутствием члена кручения grj в пробном простран- пространстве: билинейная интерполяция воспроизводит его точно (в до- дополнение к линейным членам а\ + аг? + «зт) в случае треуголь- треугольника). Результат этих авторов для четырехугольников состоит в том, что смешанные производные х\^ и у%ц не появляются в множителе \\F\\h и можно достичь ожидаемого порядка аппрок- аппроксимации. Аналогичное заключение верно для биквадратичных и бикубических функций. Следствия неравенства B3) сформулируем в виде теоремы. Теорема 3.6. Предположим, что пробное пространство на плоскости ?, т) имеет степень k— 1, а преобразования F элемен- элементарных областей в плоскость х, у равномерны при h-+0. Тогда если ие^(^). то интерполянт Uj^Sh удовлетворяет неравен- неравенствам А grad (и - щ) I2 dx dyX'2 < С'А*-> || и ||*. Постоянная С та же, что в B3). Следовательно, скорость схо- сходимости решения uh метода конечных элементов для дифферен-

3.3. КРИВОЛИНЕЙНЫЕ ЭЛЕМЕНТЫ 193 циального уравнения второго порядка равна /i2(ft-!) для энергии деформации. Неравенства теоремы относятся только к функциям и их пер- первым производным, т. е. к случаям s = О и s = 1 в B3). Аппрок- Аппроксимация порядка hh~s выполняется также для производных выс- высших порядков внутри каждой элементарной области, но когда элементы объединены, интерполянт Ui не более чем непрерывен и принадлежит лишь Шх на всей области Q. Требуемая в теореме равномерность — условие довольно су- суровое и заключается по существу в следующем: 1. Якобианы должны быть строго больше нуля, так что все углы должны быть строго между 0 и я. 2. Стороны элементов на плоскости х, у должны быть полино- полиномами с равномерно ограниченными производными, т. е. кривизны и производные высших порядков вдоль сторон должны оставать- оставаться ограниченными. В частности, стороны могут отклоняться от прямых лишь на величину O(h2). Тогда для удачно выбранного отображения F будет \\F\\k ^ const. Вычисления Фрида [Ф13] демонстрируют необходимость ус- условия 2. Он увеличивал кривизну сторон, пока их отклонение от исходного квадрата не стало того же порядка, что и размеры самого квадрата. На единичном квадрате это еще означает ог- ограниченность кривизны, но изменение масштаба до размера 1г делает кривизну (т. е. вторую производную) величиной порядка \Jh. Численные результаты были соответственно бедны. Эле- Элементы, рассматриваемые в практических задачах, занимают про- промежуточное положение между этими чрезмерно искаженными элементами и элементами, близкими к прямолинейным, требуе- требуемым по предположению равномерности в теореме 3.6. С другой (счастливой) стороны, предположим, что криволи- криволинейный элемент расположен на границе области Q, т.е. одна его криволинейная сторона принадлежит истинной границе Г. (Обычно полиномиальная аппроксимация Г и состоит в интер- интерполировании истинной границы в указанных узлах.) Тогда для гладкой границы Г условие равномерности на этой стороне вы- выполняется автоматически. Интерполированная полиномами сто- сторона будет отклоняться лишь на O(h2) от прямой, и кривизны будут оценены через кривизну границы Г. Следовательно, изо- параметрическая техника для уравнения второго порядка позво- позволяет работать с главными краевыми условиями без потерь в точности и простоте по сравнению с естественными краевыми условиями. То же относится к внутренней границе. Улучшение, которого можно достичь этим приемом, огромно по сравнению с аппроксимацией границы многоугольником. 7 Зак. 287

194 3. АППРОКСИМАЦИЯ Зламал [37] в экспериментах с кубическими треугольными эле* ментами, например, обнаружил разницу в порядке величины перемещений, а еще больше в деформациях. Без сомнения, эта техника успешно применяется к задачам второго порядка '). Для уравнений четвертого порядка (например, задачи о пла-' стине и об оболочке) ситуация гораздо менее удачна. По теории преобразование координат обязательно должно быть класса 9": его первые производные должны быть непрерывны между эле- элементами, иначе пробные функции будут несогласованными. (Схо- (Сходимость для несогласованных элементов все еще возможна, как х,у 1,п Рис. 3.9. Ограничения на отображение класса "ZP'v мы докажем в следующей главе. Однако для элементов в за- задаче о пластине даже эта надежда рушится, потому что они не могут выдержать кусочное тестирование.) Преобразование коор- координат класса 9'1 теоретически возможно, но требование допол- дополнительной непрерывности чрезвычайно обременительно (рис. 3.9). Как только в точке известны два направления (в точке Р каса- касательные к РА и РВ устанавливаются, когда S отображается в Q), все другие направления полностью определяются. (Для любой функции f(x,y) класса 9" все производные по направле- направлению можно вычислить из градиента, т. е. из производных fx и fy в двух направлениях.) На рис. 3.9 это значит, что касатель- касательная к PC определена. В самом деле, кривая СРА должна иметь непрерывную касательную в точке Р, так как ера — отрезок ') Гордон и Холл недавно предложили отображать.в квадрат сразу всю область Q, а не поэлементно. Для этого они используют составные функции, вариант обычных конечных элементов. Если сама область Q ие слишком от- отличается от квадрата (отображение круговой области создаст искусственные особенности в углах), это даст выигрыш во времени по сравнению с изо- параметрическим методом на каждом элементе.

3.4. ОЦЕНКИ ОШИБОК ' 195 прямой. Отсюда следует, что общую четырехугольную или тре- треугольную сетку (даже прямолинейную) нельзя перевести в рав- равномерную сетку преобразованием координат класса 9". Отобра- Отображение на рис. 3.9 можно осуществить бикубическими эрмито- эрмитовыми элементами, например допускающими кубические криволи- криволинейные стороны. Но касательные к сторонам, а в случае эрми- эрмитовых полиномов еще и смешанные производные л^„ и ущ должны быть непрерывны в вершинах. Это суровое и почти не- неприемлемое теоретическое ограничение на изопараметрическую технику для задач четвертого порядка. По-видимому, это знак того, что не стоит работать с уравне- уравнениями четвертого порядка вместо систем второго порядка. Ана- Аналитически исключение неизвестных может иметь огромное значе- значение, но ре численно. Конструкция полиномов класса 9" на эле- элементах с прямыми границами уже трудна, а на криволинейных элементарных областях (особенно, когда мы приступаем к чис- численному интегрированию) — бесконечно хуже. 3.4. ОЦЕНКИ ОШИБОК В этом разделе мы применим предыдущие теоремы об ап- аппроксимации для достижения главной цели всей нашей теории: нахождение оценки ошибки и — uh метода конечных элементов. Функция и служит решением n-мерной эллиптической краевой задачи порядка 2m, a uh — ее приближением Ритца, вычислен- вычисленным в пространстве метода конечных элементов Sh. На равно- равномерной сетке уравнения метода конечных элементов KQ = F становятся системой разностных уравнений, и мы находим од- одновременно порядок точности этих разностных уравнений. Основной вопрос заключается в том, насколько хорошо под- подпространства Sh приближают все допустимое пространство Шт. В энергетической норме ничего другого и не происходит: uh близко к и насколько возможно, а ошибка в энергии должна быть оптимального порядка /i2(ft-m): а (и — и\ и — uh) < C2h2 <fe-m> || и |||. B4) Это простейшая и тем не менее основная оценка ошибки. Так как выражение a(v, v) для энергии деформации положитель- положительно определено (другими словами, задача эллиптична: a(v, и) ^ ^ст||и||^), то неравенство B4) равносильно неравенству || и — ы* IL < с'Л*-1[ и ||fc. B4') Для перемещения, или вообще для s-x производных, сразу же возникает вопрос: имеет ли и — uh снова оптимальный поря- порядок hk-*? Тогда бы все определялось степенью k—1 конечных

196 ¦ з. аппроксимация элементов, но это не совсем правильно. Если зафиксировать Sh и увеличить порядок задачи 2т, то в итоге пробные функции более не будут допустимыми, и метод Ритца потерпит неудачу. Поэтому порядок точности должен как-то зависеть от т, а не только от k и s. Правильный порядок можно вычислить с помощью изящ- изящного вариационного доказательства, принадлежащего Обэну и Нитше. Доказательство известно как прием Нитше; оно было расширено Шульцем и теперь представляет собой стандартный подход к ошибкам в перемещениях. В разд. 1.6 была установле- установлена ошибка h2 для линейных элементов; общий случай сложнее, но результаты B5) — B6) очень просты. Верхний предел 2(k— m) скорости сходимости получен первым автором [С 12]. Теорема 3.7. Предположим, что степень пространства метода конечных элементов Sh равна k—1, а энергия деформации имеет гладкие коэффициенты и удовлетворяет условию эллип- эллиптичности a\\ufm^.a(v, v)^K\\vfm. Тогда приближение метода конечных элементов uh отличается от истинного решения и на величину Wu-u^KCh^Wuh, s>2m-?, B5) II ы - и* II,<СА2 <*-"•>|| и ||fe> s<2m-6. B6) Эти показатели степени h оптимальны, так что порядок точности никогда не превышает 2(k — m) в любой норме; почти во всех- реальных случаях порядок равен k — s. Доказательство. Прием Нитше состоит во введении вспомогательной задачи Lw = g, вариационная форма которой (уравнение виртуальной работы) есть а (до, v) = (g, v) для всех v e 2ё%• B7) Из теории уравнений в частных производных известно, что су- существует единственное решение до с производными на 2т по- порядков больше, чем у правой части f: \\w\\2m_s^c\\g\\_s. Возьмем v = u — uh в B7): I (g, и - uh) | = | a(w, и - uh) | = | a (w - v\ и - ий)|< B8) Неравенство справедливо для любой функции vh e Sh, тйк как a.(vh, и — uh) = 0 по основной теореме Ритца 1.1. Теперь пред- предположим, что vh — ближайшее приближение к до в норме про- пространства Шт. (Или, что по существу то же самое, пусть vh — решение вспомогательной задачи B7) методом конечных эле- элементов и потому наилучшее приближение к до по энергии. Заме-

3.4. ОЦЕНКИ ОШИБОК 197 тим, что в доказательстве используется аппроксимация только по энергии и никогда — прямая аппроксимация в норме про- пространства 36s'.) В соответствии с теоремой об аппроксимации 3.3 chk~m\\w\\k, если В первом случае число k сводится к 2т — s до применения тео ремы об аппроксимации; если подпространство полно для сте пени k—1, то оно, несомненно, полно для любой меньшей сте пени. Подставляя B4') и B9) в B8), получаем (g, и - и*) I < Kc I hk_m \ || w ||2m_s c'h*-™ || и \\k < По двойственности в определении отрицательных норм (фор- (формула E8) в гл. 1) Доказательство закончено. Оно наиболее прямолинейно для пере- перемещений^ = 0, поскольку в этом случае правая часть g во вспо- вспомогательной задаче есть в точности и — uh; такой вйбор был сделан в разд. 1.6. Аналогичный результат верен для неоднородных главных краевых условий [С8]. Кроме того, оценки ошибок распростра- распространены на задачи вынужденных колебаний, в которых основное условие эллиптичности a(v, v)^a\\v\fm нарушено добавлением нового члена нулевого порядка. Действительно, исходное диф- дифференциальное уравнение, Lu = / заменяется на Lu — au = f: если а попадает между двумя собственными значениями опера- оператора L, то оператор L — а уже положительно определен, но уравнение все же имеет решение. Шульц [Ш5] доказал, что ско- скорость сходимости не изменяется. Замечания. Случай s = /п, соответствующий ошибке в энергии, всегда дает правильную степень hh~m. Ошибка в прбиз- водных более высоких порядков для s > in не устанавливается в теореме в том виде, как она сформулирована, поскольку w не принадлежит Жт и B9) не имеет смысла. Тем не менее показа- показатель k — s будет правильным внутри каждого элемента, если только подпространство Sh удовлетворяет обратной гипотезе:

198 з. аппроксимация каждое дифференцирование пробной функции vh увеличивает ее максимум самое большее в cjh раз. Эта гипотеза означает почти то же, что и условие однородности B), за исключением того, что там был множитель c/hf, поэтому обратная гипотеза выпол- выполняется, если все элементарные области сравнимы по размеру. Иначе в оценке ошибок для производных порядка s > m по- появится МНОЖИТеЛЬ (/lmax//lmln)s~m- Теорема и ее доказательство переносятся без изменений на случай s <[ 0. Удивительно, но скорость сходимости в отрица- отрицательных нормах имеет не только академический интерес. При- Причина в том, что ошибка в норме || ||_i служит границей ошибки, усредненной по области: u — uh\\ ,=max \\(u-uh)vdx \(u-uh)dx ->-ИЛ - It, II, ^ (rnesQ) ' если положить v == 1. Поэтому в обычном случае k>2m из теоремы 3.7 вытекает такое следствие для s = —1: усредненная ошибка намного меньше обычной ошибки перемещения в точке. Точнее, [\и — uh\2dx~h2k, но \[(u — uH)dx2< Это должно означать, что знак ошибки быстро меняется. В дей- действительности это происходит внутри каждого элемента, и прак- практическая задача — отыскать хотя бы приблизительно «специаль- «специальные точки», где меняется знак. Вблизи таких точек точность перемещения uh будет особая. (Если представить себе, что уравнение —и" = 1 решается с помощью линейных элементов, это даст отличный пример: uh совпадает с интерполянтом Ы/, так что точность в узлах будет особой1). Однако исследуя тщательнее, получим, что усреднен- ') Явление «сверхсходимости» в узлах недавно прояснилось с помощью изящного рассуждения Дюпона и Дугласа. Пусть Ga(x)—фундаментальное решение, соответствующее точке Хи, т. е. Go — реакция на точечную нагрузку fо = б (х — Хо). Тогда | и (хо) - ин (х0) К С || и - ин \\т || Go - vh In для всех ~vh e= Sh. Доказательство. и (хо) — uh (*о) = (и — и\ f о) = a(u — uh, Go) = = а (и — uh, Go — vh). Наиболее интересен случай, когда х<> — узел, так как аппроксимация решения Go, вероятно, наиболее удачна. В одномерном случае для уравнения —и" = f решение Go линейно изменяется с переменой угла наклона в Хо и его можно точно воспроизвести функцией vh. Это подтвер- подтверждает неограниченную точность в этом специальном случае. Как правило, член !l Go — vh || будет добавлять к степени Л*-т, возникающей из II и — uh ||m, некоторую конечную степень h. В настоящее время тщательно изучается во- вопрос поточечной сходимости в целом и, в частности, эти увеличения степени h (сверхсходимость) в специальных точках.

3.4. ОЦЕНКИ ОШИБОК 199 ная ошибка есть величина того же порядка h2, что и ошибка в обычной точке. В самом деле, линейный интерполянт никогда не проходит выше истинного (квадратичного) решения, так что ошиб- ошибка целиком односторонняя. Объясняется это тем, что условие k > 2т для появления ошибки hk+{ не выполнено: k = 2m = 2* Узлы составляют исключение потому, что пробные функции слу- служат решениями однородного дифференциального уравнения —и" = 0[Х1, Т5]. Это вовсе не пример быстрых перемен в знаке.) Напряжения находятся в аналогичном положении. Для задач второго порядка их ошибки равны hh~} в обычных точках и hk в среднем. Следовательно, эти ошибки также должны менять знак и должны существовать особые точки напряжения. Их на- наличие заметил в реальных расчетах Барлоу; для квадратичных функций на треугольниках особыми оказываются середины сто- сторон. Точность в этих узлах лучше, чем в вершинах, где даже после усреднения результатов по соседним элементам прибли- приближения напряжений неудовлетворительны. Так как середины сто- сторон служат также узлами для квадратичных элементов, то си- ситуация чрезвычайно благоприятна. Она может испортиться лишь ошибками от изменения области, которые необязательно меняют знак. Мы думаем, что точки напряжений можно обнаружить сле- следующим образ'ом. Главный член в ошибке определяется задачей аппроксимации пробных функций из Sh полиномами Ph степени k в энергетическом смысле. На равномерной сетке эту задачу можно решить точно. Точки напряжений определяются тем свой- свойством, что истинные напряжения (производные от /\) совпадают с их приближениями (производными от полиномов низшей сте- степени). В одномерном случае для элементов первой степени ра- равенство выполняется в серединах интервалрв, т. е. там, где на- наклон квадратичной функции равняется наклону ее линейного ин- терполянта. (Или, что эквивалентно, там, где функция ошибки на рис. 3.3 имеет горизонтальную касательную.) По соображе- соображениям симметрии середины должны были бы быть особыми точ- точками также для элементов высшей степени. (Особые точки для перемещений расположены иначе, а в простейшем случае это нули второго полинома Лежандра. Они оказались чувствитель- чувствительнее к краевым условиям, чем точки напряжения.) Для двумер- двумерного случая результаты могут зависеть от выбора полиномов Рь и особые точки для одной компоненты напряжения необязатель- необязательно будут такими для других. Середины сторон, вероятно, ока- окажутся особыми для производных вдоль сторон, но не для на- напряжений в направлении нормали. Пока это объект исследова- исследования, но в конце концов эти специальные точки будут изучены и поняты полностью.

200 3. АППРОКСИМАЦИЯ Для равномерных сеток возникают три дополнительные про- проблемы: 1. Интерпретировать KQ = F как систему конечно-разно- конечно-разностных уравнений с соответствующими локальными ошибками усечения. 2. Доказать оптимальность показателей степени в теореме 3.7. 3. Показать, что для гладких решений те же скорости сходи- сходимости не только в среднем, но в каждой отдельной точке. Мы не собираемся обсуждать технические подробности, в частности, проблемы 3. Грубо говоря, раз поведение ошибок от- отсечения установлено, центральный вопрос — устойчивость раз- разностного оператора К. Это свойство трудно установить в макси- максимальной норме, но для упомянутой ранее обратной гипотезы оно почти наверняка выполняется. Мы проверили его для модельных задач с постоянными коэффициентами, ошибка в каждой точке области оказалась правильного порядка. Более точные резуль- результаты получили Нитше, Брамбл и Сиарле с Равьяром, но общая задача не решена. Для проблемы 1 предположим сначала, что на каждом квад- квадрате сетки только один узел (и одно связанное с ним неизве- неизвестное); это случай линейных элементов на правильных треуголь- треугольниках, билинейных элементов на квадратах и сплайнов. Тогда KQ = F будет выглядеть точно как общепринятое разностное уравнение. Этот факт привел к бесчисленным дискуссиям о связи между конечными элементами и конечными разностями. Ясно, что не все разностные уравнения можно получить подходящим выбором элемента: матрица К должна быть симметричной и по- положительно определенной, но даже при этих ограничениях со- соответствующий элемент может отсутствовать. С другой стороны, достаточно терпеливый читатель может пожелать рассматри- рассматривать все уравнения метода конечных элементов (даже на нерав- неравномерной сетке с многими узловыми неизвестными) как конечно- разностные уравнения. Мы приветствуем это намерение. Вообще система KQ = F дает новый тип объединенных разностных урав- уравнений, который в принципе можно было изобрести без вариа- вариационного принципа в качестве посредника. Исторически, конеч- конечно, это почти никогда не случалось. Метод конечных элементов систематически приводит к специальному классу уравнений (пе- (пересечению всевозможных разностных уравнений со всевозмож- всевозможными уравнениями Ритца — Галёркина), удивительно удачному при вычислениях. Если коэффициенты исходного дифференциального уравнения Lu = f постоянны, то порядок локальной ошибки отсечения мож- можно проверить следующим образом. Пусть f(x)—чисто показа- показательная функция eiix, так что и можно найти точно и подставить

8.4. ОЦЕНКИ ОШИБОК 201 в разностное уравнение. Ошибка отсечения будет иметь вид e&xE(h,\). Например, в задаче —и" = f решением будет и = е^хЦ2, и ошибка отсечения для h~2(—Uj+\-\-2u} — Uj-i) = fj равна Вообще коэффициент Е можно выразить через преобразования Фурье пробных функций. (Здесь мы попали прямо в суть абст- абстрактного метода конечных элементов: эта техника на неравно- неравномерной сетке была бы невозможна.) При разложении Е в ряд по степеням h старший показатель равен как раз порядку точ- точности разностного уравнения. Мы вычислили этот показатель и убедились, что он равен меньшему из чисел k и 2(k — т), т. е. скорость сходимости, указанная теоремой 3.7, правильна. Предположим, наконец, что найдется М неизвестных, связан- связанных с каждым квадратом сетки, так что уравнение метода ко- конечных элементов KQ = F становится объединенной системой М разностных уравнений. Неизвестными могут быть значения функции uh в различных узлах или значения функции и произ- производных в кратном узле. Это не вносит сложностей, если ошибка оценивается из вариационных соображений (теорема 3.7); ре- результат зависит только от порядка аппроксимации, достигаемого подпространством Sh, и любой дополнительный факт о подпро- подпространстве к делу не относится. Тем не менее при М > 1 аспект разностного уравнения становится намного тоньше. Короче говоря, проблема состоит в том, что не все ошибки отсечения в разностных уравнениях имеют ожидаемый порядок. Поэтому не так просто оценить эти ошибки, а затем, применяя устойчивость для обращения матрицы К, превратить их в оценки ошибки и — uh. Дело в том, что ifi задается специальной комби- комбинацией пробных функций и, если другие комбинации почти не вносят вклад в задачу аппроксимации, их вклад в uh также ока- оказывается малым. Напомним, что в абстрактном методе функции Фь ..., Фт порождают аппроксимацию порядка k тогда и толь- только тогда, когда можно построить из них отдельную функцию ty, обладающую свойством E), требуемым в теореме 3.2, т. е. функцию, которая сама подходит для аппроксимации. Можно считать пространство Sh порожденным этой суперфункцией ф и М—1 более или менее бесполезными функциями. Образуя соответствующую комбинацию разностных уравнений KQ = F, перепишем нашу систему метода конечных элементов в виде со- совокупности разностных уравнений специальной формы: одно уравнение системы — точный аналог исходного дифференциаль- дифференциального уравнения, остальные М— I уравнений (связанные с функ-

202 3. АППРОКСИМАЦИЯ циями в Sh, бесполезными для аппроксимации) нам совершенно безразличны. (Для больших М конструкция становится очень сложной и в качестве инструмента возможен лишь анализ Фурье; см. [С7] и [С12].) Окончательный вывод: метод Ритца при- приписывает почти весь вес одному разностному уравнению, соот- соответствующему • функции г|з, и порядок точности этого уравнения совпадает с показателем min (й, 2(k — т)) в теореме 3.7. Это и есть порядок точности (для перемещения) метода конечных элементов.

4 НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА 4.1. НАРУШЕНИЯ ЗАКОНОВ РЭЛЕЯ-РИТЦА Одно из основных правил в теории Ритца состоит в том, что пробные функции в вариационном принципе должны быть допу- допустимы. В наших обозначениях каждая функция vh должна при- принадлежать пространству Ж™, a uh — минимизировать I(vh). Сформулировать это правило просто, но оно нарушается по- повседневно и по важным причинам. В самом деле, это правило включает три условия и все они представляют вычислительные трудности — возможно преодолимые, но серьезные: 1. Пробные функции должны обладать т производными, суммируемыми с квадратом и потому быть класса <g"n-1 на гра- границах элементарных областей. 2. Главные краевые условия должны быть выполнены. 3. Функционал I (vh)= qTKq— 2qTF должен вычисляться точно. Наша цель-;-исследовать последствия нарушения этих усло- условий. Первое нарушается несогласованными элементами; в сле- следующем разделе мы покажем, что в этом случае сходимость может быть и может не быть. Совершенно необязательно (и даже не всегда вероятно), что дискретная задача совместима с непрерывной. Наоборот, к пробным функциям применяется кусочное тестирование, которое определяет, согласованно или нет они воспроизводят состояния постоянной деформации. Если да, то процесс сходится внутри каждой элементарной области. Главные краевые условия выполняются по крайней мере вдоль границы, приближенной изопараметрическими или суб- субпараметрическими элементами. Однако есть много обстоя- обстоятельств, при которых эти элементы непригодны: либо они слиш- слишком сложны для программирования вручную, либо сама задача слишком сложна — например, полная система четвертого по- порядка для уравнения оболочек. В таких случаях правило можно частично удовлетворить следующим образом: главные краевые условия могут налагаться в граничных узлах. Между узлами полиномиальные пробные функции не могут совпасть с общей

204 <-. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА границей и потому главные условия можно только интерполи- интерполировать. В разд. 4.4 мы покажем, что сходимость все же есть. Условие 3 нарушается чаще остальных, поскольку неудобно вычислять точно функционал I(v), но очень легко вычислить его приближенно. Приближение осуществляется двумя путями: интегралы по каждой элементарной области вычисляются чис- численным интегрированием или же сама область интегрирования Q заменяется совокупностью простых элементарных фигур. В обоих случаях I(v)'заменяется новым функционалом /*(и). Поэтому математическая проблема состоит в определении зави- зависимости минимизирующей функции uh от самого функционала: если деформировать выпуклый параболоид, то насколько пере- передвинется минимум? Каждое из этих трех возможных нарушений требует тщатель- тщательного анализа, если мы хотим оправдать фактическое использова- использование метода конечных элементов. Прежде чем начать изучение последствий, полезно обратить внимание на две идеи, возникаю- возникающие снова и снова на протяжении всей главы; они относятся к анализу всех трех проблем. Во-первых, всегда рассматри- рассматривается равенство нулю первой вариации, или, в физических терминах, уравнение виртуальной работы. Даже когда правила нарушены, минимизирующая функция «J все же удовлетворяет равенству а* (и*, vh) = (f, vh)* Для всех vh ^ Sh. В случае метода Ритца это сопоставимо с а (и, v) г= (f, v) для всех v e Ж™• Если Shc3e1E и / = /„ (так что звездочку можно убрать), то одно уравнение можно вычесть из другого, и, как в теореме 1.1, a (uh — и, vh) = О для всех vh e SH. В нашем случае это выражение отлично от нуля и вся проблема сводится к тому, чтобы показать, что это отличие мало. Вторая идея специфична для метода конечных элементов и состоит в использовании специальных свойств полиномов. Мы уже отмечали, как к полиномиальным решениям применяется кусочное тестирование. Ситуация аналогична численному инте- интегрированию, где точность зависит от степени полиномов, инте- интегрируемых точно. Отметим еще одно свойство, полезное для анализа изменений области: полиномы не могут значительно меняться в полосе между заданной областью Q и ее аппрокси- аппроксимацией Qh. Подчеркнем, что анализ не зависит от оценок возмущений в матрице жесткости при переходе от К к К или К*. Это измене-

4.2. НЕСОГЛАСОВАННЫЕ ЭЛЕМЕНТЫ И КУСОЧНОЕ ТЕСТИРОВАНИЕ 206 ние может быть очень большим (уравнение может оказаться совершенно другим), несмотря на то, что мы все еще работаем с полиномами степени т. На языке функционального анализа это значит, что множество таких полиномов плотно в допусти- допустимом пространстве при h->0, так что их поведение играет ре- решающую роль. 4.2. НЕСОГЛАСОВАННЫЕ ЭЛЕМЕНТЫ И КУСОЧНОЕ ТЕСТИРОВАНИЕ Некоторые из часто используемых элементов не согласова- согласованы— их производные порядка т— 1 разрывны на границах эле- элементарных областей — и тем не менее они довольно хорошо работают. Точнее, иногда они работают хорошо, а иногда — нет. Чаще всего так рискуют в задачах четвертого порядка, где элементы должны принадлежать <ё'1. Подбор наклонов между элементами может оказаться трудным для нормальных переме- перемещений w пластины при изгибе, и он чрезвычайно труден для оболочек. Поэтому технический прием состоит в обычном вычис- вычислении энергий внутри каждого отдельного элемента, а затем сложении результатов. Вследствие этого истинный функционал I(v) заменяется суммой интегралов элементов. ¦ /. (v) = ? [ав (v, v) -2 (f, v)e] = a,(v, v) - 2 (f, vl e Функционал / отличается от /* тем, что в /* игнорируются особенности на границах элементов, в то время как для несо- несогласованных элементов I(v) = оо. Приближение по Ритцу м? является (возможно, несогласо- несогласованной) функцией из пробного пространства, минимизирующей U(vh). Такое свойство mJ выражается, как обычно, равенством нулю первой вариации от /*: at(ub,vh) = (f,v% для всех c'eS'. A) Это приближенное уравнение виртуальной работы. Оно совпа- совпадает с обычным уравнением, но только опять интегралы вычис- вычисляются поэлементно, а затем суммируются, причем разрывы между элементами не учитываются. Наша цель — найти условия, при которых такая аппрокси- аппроксимация и^ методом конечных элементов сходится к и вопреки ее незаконной конструкции. Этот вопрос оставался неясным, пока Айронс (см. [Б7]) не выдвинул простую, но блестящую ¦идею, известную как кусочное тестирование. Предположим, что произвольная группа элементов находится в состоянии постоян- постоянной деформации: и(х,у) — Рт(х,у), где Рт — полином степени т. Тогда, поскольку этот полином принадлежит Sh (даже на несо-

206 <• НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА гласованные элементы наложено условие постоянной деформа- деформации: степень k—1 подпространства должна быть не менее т), истинное решение Ритца uh тождественно совпадает с Рт. (На границе рассматриваемой группы налагаемые условия выби- выбираются согласованными с постоянной деформацией, т. е. для перемещений требуется, чтобы uh = Рт на границе группы эле- элементов.) Тогда тестирование состоит в том, чтобы выяснить, совпадает ли решение инщ метода конечных элементов с полино- полиномом Рт, несмотря на несовпадение / и /* в результате игнориро- игнорирования границ между элементами. Можно предположить (что мы и сделаем), что в задаче все коэффициенты постоянны, так как их изменения на элементе вносят вклад в «J лишь О (h). а & Рис. 4.1. Успешное и неудачное кусочные тестирования. В [Б7] приведен знаменитый пример, в котором элементы формы б (рис. 4.1) выдерживают это тестирование, а для эле- элементов формы а несовпадение составляет 1,5%. (Такова ошибка для крупномасштабной энергии деформации, а поточечная ошибка напряжений достигает 25%.) Здесь рассматривается кубическая функция с параметрами v, vx и vy в вершинах. Деся- Десятое неизвестное исключается с помощью ограничения на коэф- коэффициенты. Авторы неодобрительно относятся к приравниванию коэффициентов при х2у и, ху2, потому что это ограничение на правильном треугольнике может нарушаться: все девять узло- узловых параметров функции ху(\—х — у) на стандартном тре- треугольнике равны нулю—; ограничение выполнено, а полином не равен тождественно нулю. Поэтому авторы выбрали условие, инвариантное относительно вращения и никогда не вырождаю- вырождающееся. Для неправильных треугольников много шансов, что они не выдержат кусочного тестирования. Тем не менее может быть приемлемой ошибка в несколько процентов, особенно когда, она совершается в направлении, противоположном истинной ошиб- ошибке метода Ритца. Как объяснялось в разд. 1.10, последняя всегда

4.2. НЕСОГЛАСОВАННЫЕ ЭЛЕМЕНТЫ И КУСОЧНОЕ ТЕСТИРОВАНИЕ 207 возникает из-за слишком жесткой конструкции: a(uh,uh)^ ^ а(и,и); требования к несогласованному решению «J слабее, а его перемещения, как и деформации, часто превышают оценку. Один подход к теории заключается в том, чтобы сразу рас- рассматривать дискретную систему KQ = F как конечно-разностное уравнение, забывая, что оно не так выведено. Если это уравне- уравнение согласовано и устойчиво, то решение i& должно сходиться к и. Для равномерной сетки это составляет как раз суть кусоч- кусочного тестирования: оно представляет собой контроль согласо- согласования1). Обычно несогласованные элементы имеют только на одну производную меньше, так что vh e <ё>гп~2, и согласование в дифференциальном уравнении гарантируется для членов мень- меньшего порядка. Тогда кусочное тестирование в случае б (рис. 4.1) подтверждает согласование для разделенной разности самого высокого порядка, в то время как в случае а доказано, что уравнение KQ = F будет аналогом неверного дифференциаль- дифференциального уравнения с новым главным членом. Эту связь лгежду согласованием и кусочным' тестированием можно установить методом Фурье. Мы опускаем детали, потому что этот метод ограничивается на деле равномерной сеткой и требует много подготовительной работы. Второй подход к теории несогласованных элементов — вариа- вариационный и потому более общий. Мы утверждаем, что вариацион- вариационный смысл успешного кусочного тестирования таков: для каж- каждого полинома Рт и каждой (несогласованной) базисной функ- функции (fj а.(Л»,Ф/) = а(Ят,Ф./). . B) Равенство B) справедливо тогда и только тогда, когда кусочное тестирование выдержано. Заметим, что правая часть корректно определена. Главные члены представляют собой произведение т-х производных от Рт, являющихся постоянными, на т-е производные от- несогласованных функций cpj, являющихся б'функциями, когда направление производной нормально к гра- границам элементов. Поэтому вклады границы конечны: они вычис- вычисляются из скачка в нормальной производной порядка т—1, как мы покажем на пример'е. Эти вклады необязательно нуле- нулевые: кусочное тестирование может оказаться неудачным и схо- сходимости не будет.. Для того чтобы доказать эквивалентность равенства B) кусочному тестированию, рассмотрим участок, вне которого функция ф/ тождественно равна нулю. Предположим, что истин- 4) Напомним, что для разностных уравнений согласование проверяется исследованием нескольких первых членов ряда Тейлора, т. е. рассматриваются полиномы вплоть до одределенной степени. Кусочное тестирование делает точно, то же для конечных элементов.

208 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА ное решение и равно Рт, и заметим, что соответствующая на- нагрузка f (если она есть), несомненно, не содержит 6-функций на границах элементов: Вводя-два уравнения виртуальной работы, получаем а, (и?, Ф/) — а (Рт, ф/)- Если кусочное тестирование выдержано, так что приближенное решение «? совпало с Рт, то очевидно, что равенство B) спра- справедливо. Обратно, предположим, что B) справедливо для всех фу. Тогда а, ("?> Ф/) = а*(Лп, Ф/) и обязательно «J = Pm: кусоч- кусочное тестирование выдержано. Следует упомянуть об одной технической трудности в этом доказательстве. Обычно первая вариация не должна обращаться в нуль в направлении функции фу, лежащей вне Жт. Однако для гладкого решения и = Рт можно показать (на основе интегри- интегрирования по частям [С9]), что это обязательно происходит: а(и, ф^) = (f, фу), а приведенные выше рассуждения верны. Ко- Короче, равенство B) как раз и проверяется кусочным тестирова- тестированием. Возможно, простейший пример, на котором можно проверить кусочное тестирование, доставляют прямоугольные элементы Вильсона [В 10]. К обычным билинейным функциям (на квадрате — 1 sg: х, у sg: 1 четыре базисные функции A ± х) A ± у)/4) он добавляет две новые: ф и г|х Внутри квадрата ф=1—х2 и г|з = 1—у2, а вне его они доопределены нулем, и потому они разрывны на границе. Так как они равны нулю вне элемента, то решение окончательной линейной системы допускает статиче- статическую конденсацию, а эффект от ф и if должен позволить улуч- улучшить представление внутри каждого элемента. Вследствие раз- разрыва тем не менее понадобилось кусочное тестирование. Для простоты предположим, что дифференциальное уравне- уравнение имеет видч—А« = f. Энергетическое скалярное произведение равно а (и, v)= \ \ uxvx + uuvy, и если Р = а + Ьх-\- су — про- произвольный полином степени т = 1, то 1 1 МЛф)=$ J b\-2x)dxdy = 0 -1 —1 С другой стороны, по формуле Грина

4.2. НЕСОГЛАСОВАННЫЕ' ЭЛЕМЕНТЫ И КУСОЧНОЕ ТЕСТИРОВАНИЕ 209 Выберем достаточно большую область, чтобы внутри целиком содержался заданный квадрат; тогда функция <р обратится в нуль на границе и интеграл по прямой будет равен 0. Так как —ДР = —Рхх — РуУ^=0 для любого линейного полинома Р, то а(Р, ф)= 0 = а*(Р, ф), и кусочное тестирование выдержано. Кусочное тестирование, очевидно, представляет собой очень простое правило: истинное значение а(Рт, ф^-) равно нулю, как мы только что видели, и потому требуется, чтобы интеграл от каждой деформации Dmq>j (вычисленный несогласованным обра- образом — без учета границы элементов) также был равен нулю. Это можно проверить аналитически — кусочное тестирование осу- осуществляется без ЭВМ. Величина этих интегралов, когда они не равны нулю, определяет степень несовместности несогласован- несогласованных уравнений. Другой способ достижения этого_ результата состоит в при- применении теоремы Грина на отдельном квадрате: Так как ф = 0 на вертикальных сторонах х = ±1, остается один интеграл вдоль нижней стороны и другой — в обратном направ- направлении по верхней стороне. Так как производная дР/дп в одном случае равна —с, а в другом -\-с, то i -1 ф|?-^= J (l-x2)(-c)dx + \ (l~x2)c(-dx) = 0. Таким образом, опять тестирование выдержано. Тестирование не выдержано для четырехугольника произвольной формы, когда он построен изопараметрически: ф=1 — |2, ty = 1—ц2, х, у — билинейные функции от | и ц, отображающие обычный квадрат в заданный четырехугольник. На самом деле кусочное тестиро- тестирование могут не пройти даже четырехугольники разумной формы, так что элементы становятся непригодными. Для того чтобы прошли тестирование изопараметрические элементы, Тейлор из- изменил несогласованные функции ф и if, а затем модифицировал также численные квадратуры — зло исправляется злом. Существует второй несогласованный элемент, в равной сте- степени простой и полезный. Он составлен из кусочно линейных функций на треугольниках. Предпочтительнее выбирать узлы не в вершинах, что дает непрерывность на каждой границе между элементами, а помещать их в середины сторон. Поэтому непрерывность между элементами пропадает (за исключением этих середин) и пробное пространство получается большей раз- размерности— грубо говоря, его размерность в три раза больше

210 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА размерности обычного пространства Куранта, так как она рав- равна отношению числа сторон к числу вершин. Это большее про- пространство позволяет наложить еще условие div vh = 0 на сто- стороне и все же сохранить достаточно степеней свободы для аппроксимации. Для успешной работы с этим пространством необходимо Пройти кусочное тестирование. Мы проведем тестирование, как и раньше, вычисляя интеграл \ у.дР/дп ds вдоль каждой стороны; Фактически мы интегрируем скачок в функции ф, чтобы выяс- выяснить влияние прохождения по стороне в одном направлении и затем возвращения по другой стороне. Скачок в ф'будет линей- линейной функцией, поскольку ф линейна в каждом из двух треуголь- треугольников с общей стороной. В середине стороны функция ф непре- непрерывна и скачок равен нулю. Наконец, дР/дп — постоянная, так как Р — линейный полином. Поскольку интеграл от линейной функции равен нулю, при условии что функция равна нулю в середине пути интегрирования, каждая 'пробная функция вы- выдерживает кусочное тестирование. Заметим, что от сетки даже не требовалась равномерность! Темам установил для этих элементов неравенство Пуанкаре: ||o*|g<Cfl.(i>\ v"). Мы собираемся доказать, что решения метода конечных эле- элементов, основанные на несогласованных элементах Вильсона, сходятся к и. Скорость сходимости будет минимальной —O(h2) по энергии, хотя это может не дать правильного отражения ее точности при больших h. (Существенная черта метода конеч- конечных элементов — успех на грубой сетке; даже элементы, не являющиеся сходящимися и не выдерживающие кусочное тести- тестирование, для реальных h могут дать удовлетворительные резуль- результаты.) Если элемент к тому же выдерживает тестирование для полиномов более высокой степени Рп, то скорость сходимости по энергии должна была бы возрасти до h2(n-m+l\ но это не так. Наш план — начать с общей оценки ошибки, пригодной для любого несогласованного элемента, и тем самым выделить ве- величину, которая играет решающую роль в определении ошибки. Это величина Д, определяемая формулой A=max l«.(".»»)-«(".»*)lt где , 0» |, = К {v», г»)р. vh<=Sh • I» I. Затем для отдельного элемента, изучаемого выше, оценим Д и выведем скорость сходимости. Граница ошибки, на которой все основано, такова: u — wltl. C)

4.2. НЕСОГЛАСОВАННЫЕ ЭЛЕМЕНТЫ И КУСОЧНОЕ ТЕСТИРОВАНИЕ 211 Это неравенство отражает, как и должно, порядок аппроксима- аппроксимации (последний член) и влияние несогласованности: а = а* и Д = 0 для^ согласованных элементов. Для доказательства C) сравним уравнения виртуальной работы: предположим, что функция / гладкая, тогда а. (и.*, »h) = (f, v*). = (/, оА) и fl(«,o») = (f,o»). Отсюда следует, что для всех o'eS4 а, (ы — ыА, vА) = а, (ы, кА) — а (ы, аА). D) Здесь мы сразу получаем ценный результат: левая часть по не- неравенству Шварца- ограничена величиной \ и — u!i |„ | vh |„. Разде- Разделим на | vh |„ и возьмем максимум по Sh; имеем нижнюю гра- границу ошибки (мы признательны Р. Скотту за его помощь) . E) Это показывает, что оценка C), если она доказана, совершенно реальна и влечет за собой, что любой сходящийся элемент на равномерной сетке должен выдержать кусочное тестирование. Только если тестирование выдержано, Д->0. Для того чтобы закончить доказательство верхней оценки C), выберем функцию w ближайшей к и в Sh\ По неравенству треугольника I ы — и? I. ^ I и — и» I» + I и> — и? I. = m'n I " ~~ wh I* + I w ~ и* I- ¦ wh Таким образом, неравенство C) будет доказано, если устано- установить равенство последнего члена величине Д. Этот член есть максимум по всем vh отношения R = | ал (w — «А, vh) !/| vh |.. А так как w — ближайшая к и функция в Sh (т. е. проекция элемента и на Sh), то она удовлетворяет равенству а*(ш>, vh) = а*(ы, vh) для всех n'eS*. Подставляя это равенство в числитель в R и учитывая тождество D), видим, что максимум отношения R сов- совпадает с Д. Это доказывает верхнюю оценку C). Покажем, что для прямоугольных элементов Вильсона, вы- выдерживающих кусочное тестирование, Д=О(/г); это дает пра- правильную скорость сходимости для \ и — ui \t. Для получения этой оценки запишем пробную функцию в виде где ф, и \f>i — новые несогласованные базисные функции, сдви- сдвинутые в 1-й элемент. Тогда ф, = 1 — ((х — Xi)/2hiJ, где ** — ко- координата центра 1-го квадрата. Функции со* образуют обычный базис для согласованного-билинейного элемента; мы назвали их- функциями «пагоды». Тдк как они согласованы,, то они не

212 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА влияют на Д. В самом деле, на обычном квадрате числитель в Д равен (а„ — а) (и, vh) = (а, — а) (и, а<ср, + Ь$г) = = (а„ — а) {и — Рь а.ер, + b^i). Здесь использовано кусочное тестирование или скорее эквива- эквивалентное тождество B); введение линейного полинома Pi не ока- оказывает влияния. Запасшись небольшим терпением, можно оце- оценить этот вклад в Д на i-м квадрате: С|и — РД g.jajCPj + й,-г|)(. 1. ^ CAHwIlj е.|ДМ + й^Д. Мы выбрали Рь что позволяется теорией аппроксимации, для того чтобы производная от и — Pi была порядка О (Л) (напом- (напомним, что в этом примере т= 1). Теперь просуммируем вклады по всем квадратам и применим неравенство Шварца: I а, {и, vh) — а (и, vh) |< C'h ZII « II, е. II а«ф« - Деля на | vh \ф, приходим к правому неравенству C'h [| и ||2. Теперь из основной оценки C) следует, что несогласованные элементы Вильсона дают ошибку \\и — «?||» = О(/г) в норме энергии деформации. Мы уверены, что эта скорость сходимости верна, но отметим два момента. A) Из эксперимента ясно, что постоянный множитель перед h намного меньше, чем он был бы без дополнительных несогласованных пробных функций. B) Не обязательно энергия деформации в w(f меньше, чем в и. Факти- Фактически сходимость сверху скорее правило, нежели исключение, как для энергии деформации, так и для перемещений. Доказа- Доказательство сходимости после удачного кусочного тестирования обсуждается далее в указателе обозначений. Айронс и Раззак в Трудах Балтиморского симпозиума [6] описали много других элементов, выдерживающих тестирование, в том числе A) прямоугольный элемент с 12 степенями свободы, откры- открытый Эйри, Адини, Клафом и Мелошем (в углах узловыми пара- параметрами служат v, vx и vy, а образующей функцией является сумма полной кубической функции и х3у,ху3), B) элемент кручения постоянной кривизны, предложенный Морли, который можно рассматривать как согласованный для принципа дополнительной энергии, C) новый элемент типа элементов Олмана — Пиана.

4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 213 Обширные вычисления с элементом A) для задачи о пла- пластине на собственные значения (элемент непрерывен, но несо- несогласован для уравнений четвертого порядка) приведены в [ЛЗ]. Они описывают определенную скорость сходимости порядка /г2 для ошибок в собственных значениях, соответствующих ошиб- ошибкам в энергии для статических задач. Это согласуется с нашим предсказанием. Заметим, что за несогласованность пришлось заплатить скоростью сходимости: для этого элемента k = 4 и теория аппроксимации должна была бы допустить скорость О(Л2№-'"))== О (/г4). Оказывается, что элемент C) выдерживает тестирование даже на неравномерной-сетке, что довольно замечательно. В са- самом деле, равенство граничных интегралов нулю, требуемое в тестировании, было бы, вообще говоря, довольно счастливым случаем даже на равномерной сетке, и нужно ожидать, что в будущем для достижения необходимой инженерам точности будут использоваться не только несогласованные, но и несходя- несходящиеся элементы. Приведенный список содержит также ряд численно интегри- интегрируемых элементов, но мы предпочитаем не рассматривать-чис- рассматривать-численное интегрирование как производящее несогласованные эле- элементы. Влияние такого интегрирования на самом деле состоит в замене истинного функционала I(v) новым, но разность между ними не содержит граничных интегралов. Поэтому численное интегрирование и ошибку, которую оно вносит в аппроксимацию uh метода конечных элементов, мы изучим отдельно. 4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ Численное интегрирование становится все более важной ча- частью метода конечных элементов. На ранних стадиях метода одно из основных его преимуществ заключалось как раз в об- обратном, а именно интегрирование полиномов на треугольниках и прямоугольниках было основано на точных формулах. В на- настоящее время, по-видимому, особая простота полиномов более не играет существенной роли и рациональные функции, и функ- функции даже еще более общего вида так же удобны. Фактически же нет ничего более неверного: залог успеха численного инте- интегрирования в методе конечных элементов — присутствие по- полиномов. Основной вопрос таков: какая степень точности интерполя- интерполяционной формулы требуется для сходимости? Необязательно, чтобы каждый появляющийся полином интегрировался точно. Подынтегральное выражение в энергии a(v, v) содержит ква- квадраты полиномов, и формула, точная этой степени, может обой- обойтись слишком дорого. Очень важно должным образом прокон-

214 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА тролировать ту часть времени работы ЭВМ, Которая тратится на численное интегрирование. Математически мы вновь сталкиваемся"с изменением функ- функционала /(и); это влияние вычислительных квадратурных фор- формул. Предположим, что истинный функционал равен / (v) = a (v, v) - 26 (/, v) = J \ [р (х, у) (v\ + о*) - 2/o] dx dy. (Отметим новое обозначение b(f,v) для линейного члена.) Тогда = z wt [р (io @« а,.)+0» а,.)) - 2/ % Каждая элементарная область дает определенное количество квадратурных узлов |г- = (хг-, г/г-) с весами w\, зависящими от размеров и формы элементарной области и от выбранного пра- правила численного интегрирования. Квадратурная формула назы- называется точной степени q, если интеграл от любого полинома Рч правильно вычисляется суммой 2 WiPq(li). Предположим, что /* минимизируется по всем пробным функ- функциям vh. Тогда минимизирующая функция ий=2$/Ф/ опре-- деляется приближенной системой метода конечных элементов KQ — F, в которой матрица жесткости и вектор нагрузки най- найдены численным, а не точным интегрированием. Это и есть система (не считая ошибок округления), на самом деле решае- решаемая с помощью ЭВМ. Наша цель — оценить разность uh — й~н, и мы повторим здесь основную мысль: нет необходимости в бли- близости энергий / и /* для того, чтобы разность uh — йп была мала. Сначала обсудим основную теорему, а потом докажем ее и приведем примеры. Главное условие на квадратурную форму- формулу совпадает с кусочным тестированием для несогласованных элементов: пп сходится к Ф в энергии деформации (т. е. ||ил—= — йл |!т -*¦ 0) тогда и только тогда, когда для всех полиномов сте- степени m и всех пробных функций a*{Pm,vh) = a{Pm,vb)+O{h). F) Дополнительное условие положительной определенности тре- требует, чтобы приближенная энергия деформации а* была эллип- эллиптична на подпространствах Sh, т. е. a*(vh, vh)^ Q\\vh\\2m. Член O(h) входит в условие только потому, что, если свойства мате- материала внутри элемента изменяются, это не выражается точно в квадратурах. Это второстепенный эффект. Проверка F) в действительности применяется только к глав- главным членам в энергии деформации, содержащим т-е произ-

4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 215 водные. Так как эти производные от Рт постоянны, то скаляр- скалярное произведение a(Pm,vh) содержит только интегралы от т-х производных от vh и условие сходимости сводится к следую- следующему: т-е производные от каждой пробной функции должны интегрироваться точно. Если пробные функции — полиномы сте- степени k— 1, то это условие означает, что квадратурная формула должна быть верной по крайней мере до степени k — m—1. Элементы на четырехугольниках намного капризнее: есть члены в пробных функциях, ничего не добавляющие к степени аппрок- аппроксимации, но производные их должны тем не менее интегриро- интегрироваться точно. Например, для билинейных элементов в задаче второго порядка у" члена кручения ху производная линейна, поэтому квадратурная формула должна быть точной и для этих членов, а не только для постоянных деформаций, возникающих из линейных членов а-\- Ьх -\- су. Практически равенство F) очень часто выполняется для всех линейных полиномов Рп некоторой степени п, большей т. В этом случае точность выше минимальной: ошибка в деформа- деформациях имеет порядок hn-m+1. Каждая дополнительная степень точности в квадратурной схеме вносит дополнительную степень h в оценку ошибки. Другими словами, если степень пробных функций равна k— 1, а квадратура точна степени q, то порядок ошибки равен q — k + tn + 2. Если пробные функции содержат какой-нибудь член степени выше k—1, что всегда бывает для элементов на прямоугольниках, то порядок ошибки прртится. В любом случае правильное тестирование выражается формулой а*(Р„, vh) = а(Р„, vh): точно должен интегрироваться полный полином степени п — т, умноженный на пробные деформации DmvhA). Мы не будем пытаться построить новые квадратурные фор- формулы, но удивительно, что даже на треугольниках и прямоуголь- прямоугольниках эта классическая проблема полностью не решена. Айронс [А5] показал, что еще можно сделать в этом направлении, до- добившись заданной точности q с гораздо меньшим количеством точек, чем требуется при суперпозиции обычных гауссовых ква- квадратур. Русская школа Соболева, Люстерника и др. провела глубокое изучение «кубатурных формул» на регулярных обла- областях и получила несколько замечательных формул: читателя ') Интересно подсчитать точность квадратурной формулы, требуемую для того.чтобы разность uh — йн была того же порядка hh~m в деформациях, что и основная ошибка аппроксимации. Если этот показатель совпадает с п — т+1, то n = k—1, и точно должны интегрироваться т-е производные- от всех полиномов степени k—1, умноженные на т-е производные от всех пробных полиномов vh. Если vh сами содержат все полиномы степени k — 1, как часто бывает на треугольниках, а существенные коэффициенты в энергии деформации постоянны, то главные члены в энергии — квадраты т-х произ- производных — для сохранения точности в целом должны вычисляться точно.

216 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА может заинтересовать 14-точечная формула на кубе со стороной л/2, порядок точности которой равен 5: 2л/Ъ 361 где %i — вершины куба, расположенного подобно исходному, со стороной V38/33, а г\{ — вершины правильного октаэдра, ле- лежащие на описанной сфере радиуса дЛ9/60 ! Мы повторяем, однако, что численное интегрирование для конечных элементов должно принимать во внимание члены высшего порядка, часто встречающиеся в пробных функциях на прямоугольниках, даже если они не вносят вклада в теорию аппроксимации. На тре- треугольниках элемент обычно представляет собой полный полином степени k — 1 либо близок к нему, и тогда весь вопрос сводится к правильному интегрированию полиномов возможно большей степени. Таблица 4.1 взята у Купера [К13], добавившего не- несколько новых квадратурных формул на треугольниках к фор- формулам, приведенным Зенкевичем [7]. Формулы симметричны от- относительно пространственных координат, поэтому если встре- встречается квадратурный узел |, = (?ь ?г, ?з)> то обязательно встре- встретятся и все его перестановки. Если все ?, различны, то таких узлов в квадратуре 6; если два значения ?4 совпадают, то таких узлов три, если в формуле используется центральная точка A/3, 1/3, 1/3), то лишь один раз. Изопараметрический метод не может существовать без чис- численного интегрирования, поскольку подынтегральное выраже- выражение— рациональная функция от новых координат I и г\. Пона- Поначалу кажется невозможным, чтобы даже численное интегриро- интегрирование было успешным, так как для рациональных функций оно никогда не бывает точным. Элементы a*(q>j, щ) матрицы К бу- будут совершенно отличны от элементов Kjh = a(q>j, Фй), и доказа- доказательство на основе теории возмущений невозможно. Тем не менее мы вычисляем a(Pm,vh) — a*(Pm,vh) и применяем тести- тестирование. Решающий момент состоит в том, что тестирование включает только одну пробную функцию, а не обе q>j и щ одно- одновременно, и это нас спасает. Типичное преобразование приведено в разд. 3.3 для т= 1; производная дРт/дх равна постоянной с и

Таблица 4.1 Ci Сз Кратность 0,33333 33333 33333 0,33333 33333 33333 -0,56250 00000 00000 0,52083 33333 33333 0,16666 66666 66667 0,10995 17436 55322 0,22338 15896 78011 0,37500 00000 00000 0,10416 66666 66667 0,22503300003300000 0,12593 91805 44827 0,13239 41527 88506 0,20595 05047 60887 0,06369 14142 86223 0,05084 49063 70207 0,11678 62757 26379 0,08285 10756 18374 -0,14957 00444 67670 Ъ,17561 52574 33204 0,05334 72356 08839 0,07711 37608 90257 3 - точечная формула 0,66666 66666 66667 Э-точечная формула 0,50000 00000 00000 4-точечная формула 0,33333 33333 33333 0,60000 00000 00000 6-точвчная формула 0,65902 76223 74092 6-точечная формула ,81684 75729 80459 0,10810 30181 68070 7-то1ечная формула 0,33333 33333 33333 0,73671 24989 68435 1-точечная формула 0,33333 33333 33333 0,79742 69853 53087 0,47014 20641 05115 ^-точечная формула 0,12494 95032 33232 0,79711 26518 60071 IZ-точечная формула 0,87382 19710 16996 0,50142 65096 58179 0,63650 24991 21399 13-точечная формула 0,33333 33333 33333 0,47930 80678 41923 0,86973 97941 95568 0,63844 41885 69809 степень точности 1 0,16666 66666 66667 Степень точности 2 0,50000 00000 00000 Степень точности 3 0,33333 33333 33333 0,20000 00000 00000 Степень точности 3 0,23193 33685 53031 Степень точности 4 0,09157 62135 09771 0,44594 84909 15965 Степень точности 4 0,33333 33333 33333 0,23793 23664 72434 Степень точности 5 0,33333 33333 33333 0,10128 65073 23456 0,47014 20641 05115 Степень точности 5 0,43752 52483 83384 0,16540 99273 89841 Степень точности 6 0,06308 90144 91502 0,24928 67451 70910 0,31035 24510 33785 Степень точности 7 0,33333 33333 43333' 0,26034 59660 79038 0,06513 01029 02216 0,31286 54960 04875 0,16666 66666 66667 3 0,00000 00000 00000 3 0,33333 33333 33333 1 0,20000 00000 00000 3 0.1Q903 90090 72877 6 0,09157 62135 09771. 3 0,44594 84909 15965 3 0,33333 33333 33333 1 0,02535 51345 51932 6 0,33333 33333 33333 1 0,10128 65073 23456 3 0,05971 58717 89770 > 0,43752 52483 83384 3 0,03747 74207 50088 6 0,06308 90144 91502 3 0,24928 67451 70911 3 0,05314 50498 44816 6 0,33333 33333 33333 1 0,26034 59660 79038 3 0,06513 01029 02216 3 0,4869 03154 253160 6

218 4- НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА Заметим, что матрица преобразования имеет вид -1 : \ yi ч Очевидно, что |ж == yn/J и х\х = —y%/J. С учетом этих подстано- подстановок интеграл равен с J J р F, т|) (х)\Ух1 - о{^) d\ dr\. G) Ei Рациональные функции исчезли и сходимость' будет, если этот интеграл вычисляется правильно. (Для уравнений четвертого порядка рациональные функции не исчезают и численное инте- интегрирование нельзя оправдать, если преобразование координат не удовлетворяет условию гладкости \\F\\h ^ С (стр. 193). В этом случае элементы искажены слабо и / на вид не хуже, чем переменный коэффициент р; ошибка интегрирования того же порядка, что и для постоянных коэффициентов без изопара- метрических преобразований.) В случае билинейных функций на четырехугольниках все производные х>?, уц, ¦.. линейны и, по-видимому, квадратурная формула должна быть верна для квадратичных полиномов. Од- Однако выходит так, что члены второго порядка в конкретной комбинации K=v?yr]—w(^l уничижаются, так что-для сходи- сходимости вполне достаточно точности первой степени. Практически квадратурная формула будет точнее (вероятно, она должна быть точнее, чтобы форма а* была положительно определена), и выигрыш от этого — скорость сходимости больше минималь- минимальной. Предположим, что условия разд. 3.3 выполнены: якобиан строго больше нуля, а коэффициенты преобразования координат хA, п) и у{1, т)) ограничены. Тогда, как и на плоскости х, у, каждая дополнительная степень полиномов от \ и г| увеличивает порядок аппроксимации на 1. Поэтому мы надеемся на улучше- улучшение ошибки интегрирования при тех же затратах; поскольку квадратурная формула первого порядка в билинейном случае достаточна для сходимости, ошибка в деформациях должна быть величиной О (hi), если квадратурная формула точна степени q. Еще одно замечание по изопараметрическому методу:' по- поскольку преобразования координат ~х(%, ц) и у(%, г\) имеют тот же вид, что и функция vh(t,,r\), комбинация К имеет тот же вид, что и якобиан /. Следовательно, наше правило о точной ин- интегрируемости К совпадает с правилом [7], основанным на ин- интуитивном предположении Айронса о том^ что объем каждого элемента (интеграл от J) должен точно вычисляться по квадра- квадратурным формулам. В трехмерном случае это предположение

4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 219 требует более высокий порядок точности: /Си/ содержат про- произведения трех, а не двух производных. Для субпараметрических элементов эти два правила отличаются: матрица жесткости за- зависит от К, а матрица массы и вектор-нагрузки — от /. Повто- Повторяем, что эти правила применимы к сильно искаженным изопа- раметрическим элементам; для малых искажений якобиан / гладок и при- проверке сходимости может не приниматься в расчет. Теперь приступим к теории, целиком основанной на следую- следующем простом тождестве. Лемма 4.1. Предположим, что ин и пп минимизируют функ- функционалы I(vh) и I*(vh) соответственно, так что уравнения вир- виртуальной работы (уравнения Эйлера б/ = б/* = 0) принимают вид a(uh,vh) = b(f,vh) и a*(uh,vh) = b*(f,vh) для всех vh<=Sh. Тогда а* (uh _ uht uh _ uh) = (a* _ a) (Uhf uh _ruh) _ф* _ b) (д uh _ йну (8) Доказательство. Левая часть тождества равна а* («\ uh - uh) - а* (й\ ин - uh) = = (a* — a) {uh, uh — uh) + a (uh, uh — uh) — a* (uh, uh — uh). При vh — uh — uh в уравнениях виртуальной работы последние два члена дают (b — b*) (f, uh — йн), и доказательство закончено. Можно записать похожее тождество, заменив а, Ь и uh на а*, Ь* и йн, но оно не так полезно. Заметим также, что члены в а и b фактически уничтожаются в (8), но важно сохранить их и рабо- работать с разностями а* — а и Ь* — Ь. Из этого тождества непосредственно вытекает наша главная теорема. Теорема 4.1. Предположим, что приближенная энергия де- деформации положительно ^определена: a* (vh, vh) ^ 61| vh fm, и | (a* - a) (u\ v") I + | {b* - b) (f, vh) | < Ch» \\ vh \\m. (9) Тогда ошибка приближенного интегрирования в энергии дефор- деформации равна I^-^JL^e^". do) Доказательство. Левая часть тождества (8) ограни- ограничен снизу величиной 9||ыл — "Л11т. а правая часть ограничена

220 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА сверху согласно неравенству (9), где vh = uh — йн. Сокращая на общий множитель, получаем A0). Лемма и теорема не ограничиваются только численными квадратурами. Они также применимы к изменению коэффициен- коэффициентов исходного дифференциального уравнения. Другими словами, они описывают способ зависимости решения как непрерывной, так и дискретной задач от коэффициентов и неоднородного чле- члена. Рассмотрим одномерную задачу —{ри')'-\-qu = f и пред- предположим, что р, q и f заменены на р, q и /. Тогда тождество, примененное ко всему пространству ЖХЕ вместо подпростран- подпространства Sh, превращается в \p(u'-u'f+q(u-uJ = -Р)и' («' -u') + (q-q)u(u-u)-(f-f)(u-u). A1) Левая часть, равная а*, положительно определена, если р > 0 и q"^0. В правой части каждый член меньше произведения ||и — «Hi на постоянный множитель возмущения. Это дает про- простую оценку, не самую точную из возможных, результирующего возмущения в решении. Следствие. Предположим, что коэффициенты и неоднородный член возмущены менее, чем на е: max (\p—p\, \q — q\, \ f — f I )< е. X Тогда решение также возмущается на О (г): ||и-й||,<С-|. A2) В терминах конечных элементов неравенство A2) допускает следующую интерпретацию. Предположим, что р, q и / заменены их интерполянтами в пространстве метода конечных элементов. Это возмущение — величина порядка hh. Если результирующую задачу решить точно методом конечных элементов (в интегра- интегралах по элементарным областям появятся произведения трех по- полиномов), то на основании следствия || uh — йн ||, = О (hk). Таким образом, интерполяция представляет собой возможную альтер- альтернативу численного интегрирования и ей уделяется львиная доля внимания в литературе по численному анализу; Дуглас и Дюпон [Д10] успешно исследовали даже нелинейные параболические задачи. В технических расчетах, однако, всегда предпочиталось непосредственное численное интегрирование; для изопарамет- рических элементов или элементов оболочек по существу вы-

4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 221 бирать не приходится. Грубый подсчет числа операций наводит на мысль, что и в других задачах непосредственное применение квадратур эффективнее и потому мы намерены остановиться подробнее на этой технике. Ситуация наиболее ясна, как обычно, на простейших приме- примерах. Поэтому начнем с уравнения —и" = f и применим числен- численное интегрирование к I(v)=\(v'J — 2fv. Сначала рассмотрим требование положительной определенности: wi (°2 (h)f >е S (viydx- A3) Интервал разбивается на элементы, другими словами, на подын- подынтервалы, и на каждом элементе применяется обычная квадра- квадратурная формула. Если vh — полином степени k— 1, а квадратур- квадратурные весовые коэффициенты Wi положительны, то требование положительной определенности сводится к следующему: на подынтервалах должно быть по крайней мере k — 1 точек инте- интегрирования li. В противном случае на каждом подынтервале найдется ненулевой полином степени k — 2, равный нулю в каж- каждой точке ^.Объединяя эти полиномы и интегрируя полученную функцию, мы строим пробную функцию vh, для которой не вы- выполняется требование A3): > 0, но vx(%i) = 0. Если есть отрицательные веса, то для положительной опреде- определенности понадобится еще больше точе.к интегрирования. Мы не рассчитываем на популярность таких квадратурных формул; они к тому же чувствительны к ошибкам округления. В двумерном случае для билинейных пробных функций на прямоугольниках условие положительной определенности не вы- выполняется, если взять для квадратуры правило средней точки: ft/2 ft/2 \ \ g(x, у) dxdy-h*[email protected],0). . —ft/2 -Л/2 Это одноточечная формула Гаусса на квадрате и она точна для полиномов g = 1 , х, у, ху. Тем не менее она не определена: для пробной функции vh = ху численное интегрирование выражения (уьу + (vffi дает нуль. Если положить vh = +1 или —1 в шах- шахматном порядке на всем множестве узлов в Q, то в результате получим высокую частоту осцилляции (простое кручение с наи- наименьшей длиной волньг2й, допускаемой сеткой), численная энер- энергия которой равна нулю. Это находит отражение в дискретном приближении лапласиана, возникающего из правила средней

222 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА точки; типичная строка матрицы жесткости К дает 4«/, k — й/+1, k+i — й/-1, k+i — u/+i, k-i — «/-i, *-i Это 5-точечная схема, повернутая на 45°, она, по-видимому, сильно неустойчива. На самом деле наше осциллирующее кру- кручение дает решение однородного уравнения KQ = 01)- Аналогичная одноточечная формула с узлами в центре тяже- тяжести треугольников для линейных пробных функций не будет неопределенной. Деформации постоянны и не могут обратиться в нуль в центре, не будучи тождественно равны нулю. Фактиче- Фактически лапласиан порождает обычную 5-точечную схему. Основная проверка определенности состоит в обнаружении пробных функций, которые при численном интегрировании те- теряют всю свою энергию деформации. Практически это выяс- выясняется из ранга матрицы жесткости элемента: если единствен- единственное нулевое собственное значение появляется от перемещений твердого тела, то квадратурная формула правильна. Если еще есть нулевые собственные значения, то квадратурная формула может все же быть приемлемой* надо проверить, можно ли собрать полиномы, грешащие на отдельных элементах, в проб- пробную функцию vh, обладающую слишком малой энергией на всей области (как в случае кручения, описанного выше). Например, четырехтЬчечная формула Гаусса BX2) не удовлетворяет нашему условию устойчивости для биквадратичных функций с девятью параметрами. Для гауссовых узлов (±g, ±g) на квад- квадрате с центром в начале координат функция (х2— |2) (у2— g2) имеет нулевую энергию деформации; этот шаблон можно пере- передвигать и тогда трудности будут на всей области. (Матрица К на самом деле может не быть вырожденной, если эта схема не отвечает краевым условиям (скажем, vh = 0) задачи. В этом случае можно рискнуть и испытать такую четырехточечную фор- формулу интегрирования, даже если К намного ближе к вырожде- вырождению, чем позволено теорией.) Вопрос об определенности становится довольно тонким для важных элементов с восемью параметрами, полученных из би- биквадратичных элементов исключением члена х2у2 и узла в цен- центре каждого квадрата сетки. Так как пробные функции более не содержат функцию (х2 — I2) (у — ?2), то четырех узлов Гаус- Гаусса, по-видимому, достаточно для устойчивой аппроксимации уравнения Лапласа конечными элементами. Тейлор показал, однако, что для плоской задачи упругости с двумя зависимыми *) В недавней работе Жиро проанализирована дискретная система, воз- возникающая из этой квадратурной формулы. В некоторых ситуациях она ока- оказывается удивительно полезной, хотя нарушает нашу гипотезу положительной определенности.

4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 223 переменными ситуация иная: комбинация и = х(у2 — \2), v = = —у (х2 — |2) лежит в пробном пространстве, а ее энергия деформации равна нулю для квадратурной формулы 2X2. Но Тейлор доказал также, что эту схему нельзя продолжить в со- соседний элемент. Ранг матрицы отдельного элемента слишком мал, но глобальная матрица жесткости абсолютно невырож- денна и численное интегрирование дает правильные результаты. Итак, хватит об определенности, это вопрос достаточного для интегрирования количества узлов. Теперь займемся точностью, определяемой полиномами, для которых квадратурная формула точна. Есть два пути развития теории. Один состоит в непдсред- ственном вычислении показателя р, фигурирующего в уравне- уравнении (9) теоремы 4.1. Мы изложим этот подход в двух следую- следующих абзацах, выписывая явные оценки A4) — A5) для ошибок численного интегрирования. Затем в заключительных абзацах этого раздела дадим более простое и четкое доказательство, не- непосредственно приводящее к связи между точностью квадратур- квадратурной формулы и порядком результирующей ошибки uh — й\ Дер вый подход.. Для квадратурной формулы, точной степени q, ошибка численного интегрирования \g(x)dx ограни- ограничена величиной Ch4+l \ |g(<7+1)(-*:)| dx. Это утверждение — точная копия теоремы 3.3 об аппроксимации, и доказывается оно таким же образом. Применяя его к неравенству (9) из теоремы 4.1, получаем I (а* _ а) од и\ _ а*) | < ch^ ? \ | (-1 + q(x)uh(uh-uh)]\dx, A4) \ | (?)'+I [f («" - « dx. A5) Предположим, что правая часть f гладкая, а также гладок пе- переменный коэффициент р(х). Тогда и — тоже гладкая функция, и таково же ее приближение uh методом конечных элементов. Следовательно, единственными неконтролируемыми членами в правой части будут функция uh — йн и ее производная. Каждое дифференцирование' этих пробных функций может добавлять множитель /г~1!). Казалось бы, <? + 1 дифференцирований мо- могут сократить множитель Ш+х и разрушить доказательство схо- сходимости. Это и есть то место, где существенно, что пробные ') Точнее, I vh \s+l < Ch~ {\vh\s для всех s.

224 4, НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА функции — полиномы. Так как степень полинома инх — йнх равна k — 2, то это максимально возможное число множителей h~l; дальнейшее дифференцирование аннулирует полином. Следова- Следовательно, порядок выражения в A4) равен Ш^1)-^-2) \\ uh — uh\\\. То же верно и для выражения в A5): первое дифференцирова- дифференцирование дает их — йнх, и мы приходим к тому же рассуждению. (Мы еще вернемся к этому моменту и детально покажем, почему Ъ — Ъ* имеет тот же порядок, что и а — а*, если применить оди- одинаковые квадратурные формулы.) Таким образом, р = q — k + 3 в теореме 4.1, так что в результате численного интегрирования || и — й' оценка совпадает с показателем q — k -f- tn -f- 2, полученным выше. Для iV-точечной гауссовой квадратурной формулы степень точности равна q = 2N—1, а результирующая ошибка- есть O(h2N~h+2). Поэтому использование k—l узлов в квадратурной формуле для одномерного случая очень удачно: их достаточно, чтобы удовлетворить требованию определенности, и они приво- приводят к ошибке порядка hh. Этот порядок даже ниже, чем у ошиб- ошибки аппроксимации в деформациях. В двумерном и трехмерном случаях принцип тот же. Для определенных полиномов степени q-\-\, скажем хау&, квадра- квадратурная формула не будет точна. В ошибке а* — а появляются соответствующие члены вида h h ~H Деформация Dmuh гладка, но каждое дифференцирование функ- функции Dmvh может внести множитель h~[. Условие сходимости со- состоит в том, что должно быть не более q этих множителей. По- Поэтому q + 1 дифференцирований (д/дх)а(д/ду)$ должны анну- аннулировать Dmvh для любой пробной функции vh. Другими сло- словами, функция Dmvh не должна содержать членов хау&, для которых квадратурная формула неточна. Это как раз и есть данный ранее критерий сходимости F), а именно т-е произ- производные каждой пробной функции должны интегрироваться точно. Второй подход. Предположим, что с помощью квадра- квадратурной формулы точно вычисляется интеграл от любого поли- полинома степени п — т, умноженного на т-ю производную Dmvh любой пробной функции. Мы хотим показать, следуя [С9], что р = п — т + 1 в теореме 4.1; тогда ошибка численного интегри- интегрирования в деформациях будет того же порядка h?. Для этого рассмотрим две величины а —а* и Ь — Ъ* из неравенства (9).

4.3. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ 228 Типичный член в (а — a*)(uh,vh) с коэффициентом с(х,у), выражающим свойства материала, выглядит так: с (х, у) DmuhDmvh dxdy-^WiCih) Dmuh fo) Dmv" (h). A6a) Существенный момент, вытекающий из нашего условия а (Рп, vh) = a* (Pn, vh) на точность квадратурной формулы, за- заключается в том, что этот член можно переписать в виде \\{ cDmuh-Pn-m)Dmvhdxdy- ~ ? wt {cDmuh - Рп-т) (|,) Dmvh {W. A6b) Так как численное интегрирование производится поэлементно, то можно остановиться на определенном элементе и выбрать Рп-т возможно ближе к cDmuh. В соответствии с нашей тео- теорией среднеквадратичной аппроксимации разность между ними будет порядка hn~m+l (при условий достаточной гладкости cDmuh, а это будет, если гладки данные первоначальной задачи). Суммируя результаты по отдельным элементам, видим, что ошибка A6а) имеет правильный порядок A"-m+I. Небольшие изменения этого рассуждения приводят к тем же оценкам в энергии для любых 'производных порядка меньше т, а также для члена Ъ — Ъ*. Мы опишем все шаги по оценке ошибки в последнем выражении, предполагая для простоты, что /n-е производные пробных функций vh состоят из всех полино- полиномов некоторой степени t. Тогда наше условие точности квадра- квадратурных формул сводится к правильному интегрированию всех полиномов степени п — m-\-t. Следовательно, {Ь - Ь*) (f, v*) = J J /a" dx dy - ? wt (/о*) {Id - = \ \ (/о* - Pn.m+t) dx dy - J] wt(fvh ~ Pn-m-t) (I,). Для правильно выбранных полиномов Р в каждом элементе порядки этих величин равны произведению /i"-»»+<+i на интеграл от абсолютного значения производных вплоть до того же по- порядка от fvh. Но функцию гт1 можно дифференцировать только t-\-m раз, после чего она (будучи полиномом) исчезает.. Следо- Следовательно, предполагая, что f имеет п — m-\-t-\-\ производных, получаем, что порядок ошибки Ь —Ь* равен ,п-т+\ П., ft Ц И, наконец, удаление t дифференцирований из vh оплачивается появлением множителя А-', как в примечании на стр. 223. 8 Зак. 287

226 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА Таким образом, и а — а*, и Ъ — Ь* имеют правильный поря- порядок /г"~т+1, а по теореме 4.1 таков же порядок и у ошибки в деформациях. Это основной результат настоящего раздела: если a(Pn,vh) = a*(Pn,vh), то ||и'1 — iih\\m = O(hn~m+l). Сиарле и Равьяр смогли показать [6], что даже при применении изо- параметрического метода ошибка в перемещении обычно ока- оказывается меньше ошибки в деформациях. (Их доказательство состоит в модификации приема Нитше.) Таким образом, порядок ошибки перемещения равен /г"+', и теория численного интегри- интегрирования дает удовлетворительный результат: для сходимости не- необходимо, чтобы п = т, а условия п = k—1 достаточно для , сведения ошибок численного интегрирования к уровню ошибок аппроксимации полиномиальными пробными функциями. 4.4. АППРОКСИМАЦИЯ ОБЛАСТИ И КРАЕВЫХ УСЛОВИЙ Одновременно с приближением допустимых функций из Же кусочно полиномиальными в методе конечных элементов произ- производятся и другие приближения, совершенно отличные от первых. Прежде всего можно менять саму область: Q заменяется на близкий многоугольник Qh или, в изопараметрическом методе, на область с кусочно полиномиальной границей. Любое другое приближение произвольной области вызвало бы большие труд- трудности. Далее, сами краевые условия служат объектом аппрокси- аппроксимации. Если в задаче указано, что u—~g\x,y) на Г или и„ + аи = Ь(х, у), то эти функции g и Ь почти неизбежно интер- интерполируются в узлах на границе Г (или на ее приближении). Мы хотим оценить ошибку этих приближений. В настоящем разделе подробно обсуждаются четыре, проб- проблемы: 1. Изменение области для однородного условия Дирихле и = 0 на Г. 2. Изменение области для однородного условия Неймана и„ = 0 на Г. 3. Аппроксимация неоднородного условия Дирихле и = = g(x,y) на Г. 4. Аппроксимация произвольного неоднородного условия Неймана ип + а(х, у)и = b(х, у) на Г. В каждом случае рассматривается двумерное уравнение вто- второго порядка, скажем уравнение Пуассона —Дм = f. Большей частью оно берется для удобства и простоты описания: для не- нескольких неизвестных и трехмерного пространства изменения незначительны. Для чистой задачи Дирихле или Неймана вы- высокого порядка, например для пластины с закрепленными или

4.4. АППРОКСИМАЦИЯ ОБЛАСТИ II КРАЕВЫХ УСЛОВИЙ 227 свободными краями, порядок ошибки в энергии деформации та- такой же, как мы получим ниже. Если комбинируются главные и естественные краевые усло- условия, ситуация совершенно другая. Например, в задаче о сво- свободно опертой пластине решается бигармоническое уравнение А2« = / для внутренней нагрузки, а коэффициент Пуассона v входит в естественное краевое условие: и = 0 и vA« + (l — v)«nre = 0 на Г. A7) В этой физически важной задаче, математически корректно по- поставленной, нельзя гарантировать, что решение на многоуголь- многоугольнике Qh близко к решению и на Q, если многоугольник Q'1 бли- близок к Q. Это относится как к точному решению U'1 на Qh, так и к аппроксимации uh методом конечных элементов. Требуется нечто большее, чем простая сходимость границ. Трудность легко увидеть, когда Qft — многоугольник. На каж- каждой его стороне условие Uh = О сразу заставляет производную по касательной Uu обратиться в нуль. Следовательно, второе краевое условие в A7) эквивалентно на прямолинейной стороне условию Д[/'1 = 0 и зависимость от v исчезает. Бабушка [Б1] предложил ввести новое неизвестное Vh = AUh; это дает два уравнения второго порядка Д[/Л = УЛ и AVh = f в Qh, Uh = Vh = 0 на Гл. Для такой системы второго порядка сходимость гарантируется, a Uh, Vh приближают решения задачи bJU = V и ДУ = / в Q, ?/ = У = 0 на Г. Это как раз задача о закрепленной пластине с v = 1. Таким образом, предельная функция не зависитч от коэффициента Пуассона, входящего в краевые условия. Сходимость есть, но почти всегда к неверному решению. Соответствующие трудно- трудности для расчетов методом конечных элементов представлены в [Р1] и обсуждаются в [Б 10]. С другой стороны, мы предчувст- предчувствуем успех изопараметрического метода, если аппроксимация границы Г по крайней мере кусочно квадратична; в этом случае кривизна границы сходится. Если же предположить, что главное условие и = 0 заменяется в граничных узлах условием uh — duh/dt = 0, использовать пространство Z3 (см. разд. 1.9) и взять производную d/dt вдоль истинной границы Г, то сходи- сходимость можно ожидать даже на многоугольнике. В таком изло- изложении, однако, требуемой теории не существует. Вернемся к четырем проблемам, перечисленным выше. В каж- каждом случае теория довольно сложна, но выводы делаются непо- непосредственно. 8*

228 •*¦ нарушения вариационного принципа 1. Пусть Q заменяется вписанным многоугольником Qh, a пробные функции приравниваются нулю на прямых сторонах границы ГЛ. Представим себе, что они доопределены нулем с внешней стороны границы Г\ Тогда эти функции допустимы для вариационной задачи: они равны нулю на истинной границе Г, а пробное пространство Sh — настоящее подпространство в Ж\ (Q). Следовательно, основная теорема 1.1 метода Ритца га- гарантирует, что uh минимизирует ошибку в энергии деформации: \ \ («. - *YX + (и - *% - min \ \ {и - о*)* + (и - v% A8) й s . a Так как каждая функция vh равна нулю вне Qh, то интеграл на полосе Q — Qh фиксирован: это интеграл от и2х + и2. Поэтому ик минимизирует не только на Q, но и на Qh: \ \(и — uhJx + (u — uhf = min \\ (и — vhJx + (и — vhf. A9) Весь вопрос теперь просто в оценке выражений в A8) и A9). До сих пор мы выбирали функцию vh равной интерполянту Uj. Рис. 4.2. ' Аппроксимация границы многоугольниками. Этот выбор все еще хорош, если Sh — пространство Куранта кусочно линейных функции с узлами в вершинах треугольников. Так как И/ интерполирует и = 0 в граничных узлах, то их = О вдоль всей границы многоугольника и Ui^Sh. Стандартная теорема 3.3 об аппроксимации дает величину № ошибки в энер- энергии. Несомненно, что приближение около границы очень плохое. Предположим, что используется более сложный .элемент, на- например кусочно квадратичный (рис. 4.2). Как обычно, узлы расположены в вершинах и в серединах сторон. Каждая проб- пробная функция будет равна нулю вдоль Th при условии, что она равна нулю во всех граничных узлах, но это исключает функцию их из пробного пространства Sh. Истинное решение и равно

4.4. АППРОКСИМАЦИЯ ОБЛАСТИ И КРАЕВЫХ УСЛОВИЙ 229 нулю в вершинах Р и Q, но не в середине М, так что вдоль гра- границы интерполянт отличен от нул-я. Так как М находится на расстоянии O(h2) от истинной границы Г, то по теореме о сред- среднем значении |u(M)|<CA2max|gradu|. B0) а В A9) больше нельзя выбирать vh = «/. Вместо этого удобно в качестве vh взять кусочно квадратичную функцию и], интер- интерполирующую и только во внутренних узлах и равную нулю на Гн. При таком выборе ошибка в энергии деформации на Qft равн-е (здесь мы применили неравенство треугольника). Член |« — «7|2 уже известен: по теореме 3.3 он равен О (А4). Новый член ы7 — и) представляет собой кусочно квадратичную функцию, равную нулю во всех внутренних треугольниках: единственные узлы, где Uj ф и*, лежат в серединах Mi сторон на границе Гл; в этих точках и* = 0, Uj = u — O(h2). Таких сторон ОA/Л), так что О (|) c2h* max | grad и I2 $ $ ( Здесь ф — квадратичная функция, равная 1 в среднем узле М{ и нулю в 5 других узлах треугольника. Ее первые-производные имеют порядок l/h, а площадь треугольника — порядок /г2; окон- окончательно получаем Теорема 4.2. Ошибка в энергии на Qh при аппроксимации области многоугольником удовлетворяет неравенству Ошибка в значении функции есть и — uh = O(h2). Последняя оценка (которую мы не будем доказывать) вы- вытекает из "непрерывной задачи на приближенной области: —At/* = f на Q, Uh = 0 на Г". Так как Д(м— Uh) = — f + f = 0, то по принципу максимума и — Uh достигает максимума на Гн.

230 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА Но на этой границе Uh = 0, а и '= О (Л2), так что порядок ошиб- ошибки и—Uh везде равен Л2. В теореме утверждается, что тот же результат верен для и— uh [Б19]. Отсюда следует, что если судить лишь по показателю сте- степени h и приближать Q многоугольником, то при вычислении деформации нет смысла выходить за пределы квадратичных функций формы. Более того, для достижения наилучшего из воз- возможных порядков п2 ошибки в перемещениях достаточно даже линейных полиномов. Возможно, это тот самый случай, когда показатель степени h недостаточен для отражения истинной точ- точности: действительная ошибка в вычислениях с линейными эле- элементами может оказаться чрезмерной. Подобная оценка верна и для трехмерной задачи Дирихле более высокого порядка. Самое необычное, что показатель дол- должен быть нечетным; средняя ошибка в производных от и— uh имеет дробный порядок /i3/s. Сама оценка тем не менее верна, и в действительности точное решение Uh уравнения на много- многоугольнике (которое ближе к и, чем uh, потому что минимизирует функционал на пространстве <9^(Qh), содержащем Sh) тоже имеет ошибку порядка Л3/г [Б9]. При аппроксимации границы прямоугольниками", что намного грубее, порядок становится рав- равным /г1/г; вычислительные результаты совершенно неудовлетвори- неудовлетворительны; В этом и заключается причина использования треуголь- треугольных элементов. Объясняется дробный показатель 3/2 так: имеется погранич- пограничный слой толщиной в два элемента, внутри которого ошибки в производных равны О (Л). Легко проверить, что угол 0 на рис. 4.2 есть величина того же порядка, так что истинная произ- производная от и вдоль хорды равна O(h), а не 0. Этот слой в ошибку в энергии вносит О (А3). За пределами пограничного слоя ошиб- ошибка совершенно другая: оптимальный порядок № для ошибки в перемещениях, т. е. и — uh = O(h2), и она настолько гладка, что ее первые производные также порядка п2. Ошибка ведет себя внутри области намного лучше, чем у .границы, демонстрируя тем самым свойства гладкости, присущие всем эллиптическим задачам. В аппроксимации методом конечных элементов и— и'1 вдоль каждой хорды PMQ изменяется от нуля до О (h2) и обрат- обратно; это особое поведение быстро стушевывается в направлении нормали к границе, что хорошо наблюдается в расчетах и про- проверяется непосредственно. Это вариант принципа Сен-Венана, относящегося больше к геометрии, чем, что более привычно, к краевым данным. Закон одинаков: едали от границы важно по- поведение в среднем, а не локальные коротковолновые осцил-

4.4. АППРОКСИМАЦИЯ ОБЛАСТИ И КРАЕВЫХ УСЛОВИИ 231 Ситуация не отличается от отображения единичного круга в круг с волновой границей. Предположим, что последняя опи- описывается функцией ^@) = 1 + h2 cos Q/h. Тогда при конформном отображении между этими «кругами» точка (г, 0) переходит в (г + h2rx>h cos Q/h, 0). Вся энергия заключена внутри погранич- пограничного слоя г ^ 1 — Ch; для малых г амплитуда члена «волновых» возмущений экспоненциально мала: h2rl/h </г2 A - Ch)m ~ h2e~c. Производные от отображения равны O(h) около границы. Вну- Внутри они фактически равны нулю из-за множителя г1'11. Заметим, что площади обоих кругов одинаковы; если бы один из них был вписан в другой, то появился бы дополнительный член г№, про- производные от которого не исчезают, но всюду в области .имеют меньший порядок h2. В терминах принципа Сен-Венана усредне- усреднение по локальным осцилляциям отлично от нуля и распростра- распространяется далее. Более того, если вместо волн cos Q/h у круга были бы зубцы |cos0/i|, то конформное отображение обладало бы слабыми особенностями в местах стыка. Однако при аппрокси- аппроксимации методом конечных элементов эти особенности смазы- смазываются и средняя ошибка в производных имеет порядок h у границы и h2 внутри. Известно несколько путей достижения оптимальной скоро- скорости сходимости для квадратичных функций. Уже упоминались преобразование координат изопараметрическими элементами и использование х; у элементов Митчелла с кусочно гиперболиче- гиперболическими (!) функциями в качестве границы. Еще одна возмож- возможность— вычислить поправки к аппроксимации uh многоугольни- многоугольниками [Б23] или модифицировать исходный функционал I(v) [НЗ]. Во всех этих способах несущественно, что Qh лежит внутри Q; фактически ошибка от изменения области частично гасится, если Th систематически проходит то внутри, то снаружи Г. Сно- Снова по принципу Сен-Венана главный член ошибки зависит от площади Q — Qh (с алгебраическим знаком) и предоставляет следующую возможность: усреднить приближенное решение для вписанного и описанного многоугольников. Все эти предложе- предложения, за исключением изопараметрического метода, в практиче- практических задачах в основном не проверены. 2. Рассмотрим уравнение —Au-\-qu = f с естественным краевым условием ип = 0. Здесь не возникает вопрос о наложе- наложении условий на неверную границу: пробные функции на гра- границе не подчинены никаким ограничениям. Однако область под- подвергается изменению, если неудобно проводить интегрирование по истинной области Q. Если потенциальная энергия вычис- вычисляется по приближенной области ?lh,. то это значит, что вводится

Й32 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА новое определение потенциальной энергии: /* (v) = ai(v, v) - 2 (f, v)h = \ \ (о* + v* + qv2 - 2fv) dx dy. o* Если предположить, что uh минимизирует истинный функцио- функционал / по Sh, а йн минимизирует Ih, то задача сведется к оценке eh = uh — uh. С математической точки зрения это по существу тот же вопрос, что возникает для квадратур Гаусса: интегралы вычис- вычисляются не точно. Поэтому мы применяем вариант тождества леммы 4.1; непосредственно из равенства нулю первых вариаций для и, uh и йн вытекает, что ?2 = аН (еЛ> еК) = ah („ft _ „_ gft) + (flft __ а) (Ы) gft) + Q^ eh) _ (Д eft)ft. Первое слагаемое в правой части по неравенству Шварца не превышает [ah (uh -u,uh-u)- ah (e*. е*)]1/2 < Cxhk~lE. Остальные дают интеграл по полосе Q—Qh: В = И (~ "я6* ~ иУ6У ~ qUeH + ^ dX Uy- Q-QA Предполагая, что их, иу, q и f ограничены, и снова применяя неравенство Шварца, получаем где Л — площадь полосы Q — Qft. Осталось оценить последний интеграл с помощью Е, т. е. связать размер элемента eh в по- полосе с его размером внутри области. Для произвольных функ- функций это было бы невозможно. Однако функция uh — uh никоим образом не произвольна: в каждом треугольнике она совпадает с некоторым полиномом, и эти полиномы не могут вдруг взор- взорваться— оценка на Qh влечет за собой оценку на Q. Обозначим через Т типичный криволинейный треугольник у границы, а через Th — вписанный в него прямолинейный тре- треугольник. Их разность Т—Th служит одним из кусков полосы Q — Qh. Пробные функции представляют собой полиномы на каждом треугольнике Т и нам надо оценить ошибку eh = uh — uh, вызванную интегрированием только по Th. Эта ошибка на каж- каждом треугольнике Т сама будет полиномом Р(х,у), и для нее справедлива лемма, принадлежащая Бергеру.

4.4. АППРОКСИМАЦИЯ ОБЛАСТИ И КРАЕВЫХ УСЛОВИЙ 233 Лемма 2.2. Пусть р = площадь (Т — Th)/площадь (Th). Тог- Тогда существует такая постоянная с, зависящая только от сте- степени полинома Р (х, у), что Суммирование по всем граничным треугольникам и увеличе- увеличение правой части включением в рассмотрение внутренних узлов приводят неравенство леммы к неравенству Подставляя это в оценку для \В\, получаем k-l+ C2(Acp)ll2]E. Другими словами, ошибка в энергии деформации, возникающая при интегрировании по uh вместо Q, удовлетворяет неравенству Первое слагаемое отражает энергию деформации и — uh и не добавляет ничего нового. Интерес представляет второе, чисто геометрическое слагаемое. Предположим, например, что Qh — многоугольник. Тогда площадь А равна O(h2), а отношение р для площадей соседних треугольников равно O(h). Таким обра- образом, ошибка энергии деформации при замене области много- многоугольником имеет один и тот же порядок /i3 как для естествен- естественного, так и для главного краевого условия. Мы думаем, что снова есть пограничный слой. Для изопараметрических, а не субпараметрических элементов A = O(hk) и р = О(/гй-'); их произведение h2k~l поглощается обычной ошибкой аппроксима- аппроксимации. h2k~2 в энергии деформации. Поэтому изопараметрические элементы должны быть удачны на криволинейных областях не- независимо от того, какие наложены краевые условия — главные ' или естественные. 3. Следующая проблема связана с неоднородным главным краевым условием u = g(x,y) на Г. Это условие выполняется для каждого элемента v истинного допустимого пространства Же- Поэтому две любые допустимые функции отличаются на функцию v0 e Ш\, значения которой на границе равны нулю. Предположим, что ситуация та же для пробных функций vh e Sh: все пробные функции принимают одинаковые значения на границе Г (необязательно vh = g; нельзя ожидать от полино- полиномов слишком многого, пусть, например, vh = gh). Тогда две лю-

234 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА бые пробные функции отличаются на функцию у*, равную нулю на Г. Эти функции i>J образуют пространство S*, являющееся подпространством истинного однородного пространства Ш\. Теорема 4.3. Пусть и минимизирует I(v) на Ж™, a uh мини- минимизирует I(v) на Sh. Тогда равенство нулю первых вариаций выражается формулами а(и< ио) = G.Ч) Для всех toe»J, B2) n(uh, v?) = (f, yj) для всех fj^5oft. • B3) Как и в теореме 1.1, uh обладает дополнительным минимизи- минимизирующим свойством а (и —и", и — uh) = min aiu — x/1, и — vh). B4) ofteSft Доказательство такое же, как для теоремы 1.1. Так как и и uh минимизируют функционал /, любые возмущения ev0 и bVq увеличивают его: Раскрывая формулу, видим, что коэффициенты при е должны равняться нулю, а это и есть уравнения виртуальной работы B2) и B3). Для доказательства того, что uh минимизирует ошибку в энергии деформации, запишем a(u — vh, и — vh) = а {и — uh + uh — vh, и — uh + uh ¦— vh) = — а (и — uh, и — uh) + 2a (u — uh, uh — vh) + + a (uh — vh, uh — vh). Равенство нулю среднего слагаемого получаем автоматически, вычитая B3) из B2) и полагая &J = uh — vh. Последнее слагае- слагаемое будет положительным, если vh Ф uh. Таким образом, в этой точке достигается минимум, и теорема доказана. Следствие. Пусть Q — многоугольник, а главное условие и = g(x, у) на Г интерполируется в методе конечных элементов: во всех граничных узлах пробные функции удовлетворяют ра- равенству vh(Zj) = g(zj) (или, более общо, DjVh(Zj) =Djg(Zj)). Тогда a(u — uh, и —uh)^.a(w—u,, u — Uj). B5) Поэтому оценка ошибки в методе конечных элементов сводится к обычной оценке аппроксимации и — и^.

4.4. АППРОКСИМАЦИЯ ОБЛАСТИ И КРАЕВЫХ УСЛОВИЙ 235 Доказательство. Надо проверить следующие условия: а) Интерполянт Ui должен принадлежать Sh, так что в B4) возможен выбор vh == Uj. Поскольку Uj удовлетворяет краевым условиям, налагаемым в следствии (т. е. Uj(zj) = u{zj) = gBj) в граничных узлах), это требование выполнено. б) Все пробные функции vh должны принимать одинаковые значения на границе Г, так что их разности принадлежат Ж\. Другими словами, пробные функции vh должны определяться на Г своими значениями в граничных узлах. Так как Г состоит из плоских сторон и мы предполагаем, что используется согла- согласованный элемент, то условие действительно будет выполнено. Мы колебались, давать ли обычную оценку /г2^-1) для B5), поскольку такая оценка требует, чтобы решение было гладким (и е Жк). В углах многоугольных областей почти автоматически появляются особенности в производных от и. Для уравнений' второго порядка решение и обычно не принадлежит Ж+п!а, где а — наибольший внутренний угол. Первые производные будут, действительно, аппроксимироваться до порядка hn/a, а энергия деформации —до порядка h2n/a. В гл. 8 мы рассмотрим, как со- сохранить обычный порядок /i2(fe-'), измельчая сетку в углах или (еще лучше) вводя специальные пробные функции с правиль- правильными особенностями. Предположим, что область Q, не являющаяся многоугольни- многоугольником, заменяется многоугольником Qh либо непосредственно в плоскости х, у, либо в плоскости |, Ti после изопараметрического преобразования. Если вычисления произведены на ?lh, то опять граничные узлы полностью определяют все краевые значения и можно применить следствие: окончательная ошибка поглощается суммой ошибки вы — Ui на приближенной области и изученной ранее ошибки, вызванной изменением области. Остается еще возможность работать на криволинейной об- области Q в заданных координатах х, у и интерполировать vh = g в граничных узлах. Вероятно, интегрирование следует проводить численно, особенно на криволинейных элементах у границы, хотя эксперименты в [К14] обрабатывались точными алгебраическими операциями. В этом методе краевые значения меняются от од- одной пробной функции к другой, кроме, разумеется, значений- в самих узлах. Разности между пробными функциями малы, но на Г отличны от нуля. Поэтому законы Ритца нарушаются л возникают теоретические вопросы: а) Как велики могут стать эти разности на границе? б) Отражается ли на ошибке и — uh это наихудшее из воз- возможных поведение на Г, или uh все еще оптимальное в Sh при- приближение к ы?

Й36 4. НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА Вопросы относятся даже и к однородным краевым условиям и = g = О на Г. В этом случае пробные функции равны нулю в граничных узлах ива) спрашивается, насколько велики они могут быть на остальной части границы Г. Удивительно, но от-, вет не зависит от их степени. Максимальная величина vh на Г одинакова и для линейной функции vh, равной нулю только в вершинах граничных треугольников, и для квадратичных или кубических функций, обращающихся в нуль в одном или двух дополнительных узлах на каждом куске границы Г. Она одина- одинакова даже для пространства кубических функций Z3 в граничных вершинах, обращающихся в нуль вместе со своими истинными производными по касательным. Ответ таков: существует особая пробная функция Vh с единичной энергией, среднее значение которой на Г имеет порядок п*1к Для ответа на вопрос б), т. е. для нахождения оценки для и — uh, необходимо расширить классическую теорию Ритца. Верно, что первые вариации все еще обращаются в нуль для ми- минимизирующих функций и и uh: а (и, v) — {f,v) для iis^J, a(uh, vh) = (f, vh) для c'eS', Однако Sh даже при g = 0 не будет подпространством в Ж\\' в неоднородном случае g ф О и 5о не содержится bJJ. Тем не менее еще можно привлечь формулу Грина: так как —Дм = /, то а (и, vh)=^ uxvhx + uyvhy = J J f vh + ^ unvh ds. Q Q Г При вычитании a(uh,vh) = (f,vh) остаются граничные слагае- слагаемые а (и — uh, vh) = \ unvh ds для всех vh s Sh. B6) г Это и есть тот член, который контролирует ошибку, вызванную нарушением главных краевых условий. Мы хотим показать, что ответ на вопрос б) самый худший из возможных: порядок ошибки будет определяться пробной функцией Vh, наибольшей на Г. В самом деле, для vh = Vh в B6) это легко показать. Так как Vh имеет единичную энергию, то левая часть, согласно неравенству Шварца, ограничена квад- квадратным корнем из а(и — uh, и — uh). В правой части Vh прини- принимает среднее значение /is/i и, если нет специальных упрощений

4.4. АППРОКСИМАЦИЯ ОБЛАСТИ И КРАЕВЫХ УСЛОВИЙ ' 23? (см. далее!), следует ожидать, что интеграл от unVh будет того же порядка. Поэтому ' a(u-uh, и - uh)m ~ h3'2. Это значит, что интерполирование краевых условий и интегри- интегрирование по Q даже для элемента высокого порядка не лучше, чем замена Q многоугольником Qh. (По крайней мере показа- показатель у h не лучше, а оценок привлекаемых констант у нас нет.) Одно объяснение таково: каждый пвлином, интерполирующий и = 0в граничных узлах, будет равен нулю вдоль кривой, про- проходящей близко от истинной границы, но две кривые могут от- отличаться на O(h2)—то же расстояние, что и для многоуголь- многоугольника Qh. В [Б9] показано, что /г3'2 служит также верхней границей для ошибки интерполяции краевых условий. Из преобразований, опи- описанных в этой статье, всплывает второй, еще более удивитель- удивительный факт: даже если точность ограничена существованием не- нежелательной функции Vh порядка /г''2 на Г, ошибка истинного перемещения и — uh на самом деле имеет порядок h3 на Г. Дру- Другими словами, краевые значения решения Ритца выглядят об- обманчиво хорошими. Наибольшей ошибкой должны обладать нор- нормальные производные у границы. Теперь исследуем возможность упрощений в интеграле \unvhds в правой части равенства B6). Если краевые значения vh осциллируют около нуля, то даже, хотя их средний модуль \vh\ может быть порядка А3'2, сам интеграл будет стремиться к величине меньшего порядка. Эти осцилляции происходят для некоторых элементов, но не для всех. Например, они бывают у квадратичных функций, когда условие и == О (или и = g) ин- интерполируется в граничных вершинах и в точках границы Г, расположенных посередине между ними. Главный член в vh представляет собой кубическую функцию s(s — /г/2) (s — h) от длины дуги на Г, равную нулю в граничных узлах, ее среднее значение равно нулю. Другими словами, vh осциллирует около нуля. В соответствии с этим Скотт показал, что ошибка в энер- энергии, вызванная интерполяцией и = g, улучшается до О(п^). (Это не так для кубических функций [Б9], если только узловые точки не расположить специальным образом на Г, чтобы сред- среднее значение vh сделать нулевым.) Так как обычная ошибка аппроксимации для квадратичных функций равна О (h2) в энер- энергии, граничная ошибка теперь оказывается совершенно прием- приемлемой. Мы не знаем, пригодится ли в будущем этот подход в изопараметрическом методе для граничных треугольников, а именно интегрирование непосредственно по криволинейным эле- элементам в плоскости х, у.

238 4- НАРУШЕНИЯ ВАРИАЦИОННОГО ПРИНЦИПА 4. Последняя проблема в нашем списке возникает из неодно- неоднородного естественного условия ип + а(х, у)и — Ь(х, у) на Г, а>0. Для уравнения Пуассона это приводит к появлению граничных интегралов в потенциальной энергии: /(о)= JJ^ + ^+ $au2-2 \\fv-2\bv. а .г и г Строго говоря, для этих граничных интегралов надо исследовать три вопроса: полиномиальную аппроксимацию на Г, численное интегрирование и изменение области. Два последних вопроса возникают потому, что для криволинейной границы Г вычислить точно граничные интегралы почти невозможно. Некоторые чис- численные процедуры можно приспособить, а когда пробные функ- функции определены на Qh вместо Q, интегралы переносятся на Г'1. Мы хотим опустить подробный анализ этих ошибок на Г\ так как убеждены в том, что они не больше тех, которые уже изу- изучены на Qh. Очень хотелось бы иметь строгое доказательство нашего убеждения. Новый вопрос связан с полиномиальной аппроксимацией на Г. Он возникает обычным образом: метод минимизирует ошибку в энергии: а (и — и\ u — uh) = min \\{u — vh)\ + (и — vhfy + J a (и — vhf ds. p. ¦ r Для пространства метода конечных элементов степени k—1 и выбора vh = Vi интеграл по Q имеет порядок /i2(fe-'). К счастью, интеграл по Г имеет даже более высокий порядок, скорость схо- сходимости не уменьшается от присутствия граничных интегралов. Это очевидно для границы Г, образованной прямыми: сужение пробных функций на Г дает полный полином степени k—1 от граничной переменной s, а интеграл по Г имеет порядок h2k. Нитше получил такой же результат для" криволинейной грани- границы [6]. Для изопараметрических элементов граница в плоскости %, ц прямолинейна и все граничные интегралы вычисляются непосред- непосредственно численным интегрированием. В действительности основ- основное заключение теории для краевой задачи второго порядка, по- видимому, таково: изопараметрический метод устанавливает ло- локальное преобразование координат в направлении нормали и по касательной, точнее и удобнее того, которое достигалось конеч- конечно-разностным методом.

УСТОЙЧИВОСТЬ 51. НЕЗАВИСИМОСТЬ БАЗИСА В определенном смысле здесь не должно быть проблемы ус- устойчивости. Решение эллиптической вариационной задачи зави- зависит непрерывным образом от исходных данных; если нагрузка f и все принятые на границе перемещения и силы малы, то энер- энергия деформации в и мала. Иными словами, задача корректно поставлена. Кроме того, независимо от выбора подпространства Sh энергия деформации в приближении Ритца uh автоматически ограничена энергией деформации в и; метод Ритца проектирует и на Sh, и это может лишь уменьшить энергию (следствие из теоремы 1.1). Поэтому приближенные задачи равномерно кор- корректно поставлены и всегда должна быть возможность построе- построения «устойчивого» алгоритма для численного расчета и'1. Трудность заключается в том, что для достижения полной численной устойчивости при стремлении шага сетки к нулю тре- требуемый алгоритм для решения возникающей системы уравнений может оказаться просто слишком сложным. Для~обычной пяти- пятиточечной разностной схемы можно систематически использовать все ограничения на матрицу коэффициентов, вытекающие из со- согласованности с оператором Лапласа: суммы вдоль каждой строки матрицы, а также первые моменты равны нулю на всех стадиях метода исключения Гаусса. Однако соответствующие ог- ограничения для нерегулярных конечных элементов будет чрезвы- чрезвычайно трудно использовать. Поэтому мы будем исследовать обычный алгоритм исключения, допуская увеличение ошибки округления при Л-»-0, однако имея в виду, что численная устой- устойчивость должна быть по возможности понятной; излишние чис- численные неустойчивости приниматься во внимание не будут. Известно, что ключ к устойчивости лежит в равномерной ли- линейной независимости элементов базиса cpj. Даже если uh совер- совершенно не зависит от выбора базиса, округление,, которое входит в вычисленное значение й'\ зависит от него. (С. Г. Михлин ввел понятие сильной минимальности базиса, и советские авторы часто исследуют с этой точки зрения численные методы, а также и устойчивость относительно изменений коэффициентов в диф- дифференциальном уравнении.) Обычная процедура определения ли- линейной независимости базиса состоит в рассмотрении матрицы

240 5. устойчивость Грама (в физических терминах матрицы массы), элементы кото- которой есть скалярные произведения элементов базиса: Щ = (ф/, Фи) = jj Ф/ (*) Ф* f*) ^i ... <**„• й Так как метод Ритца всегда оперирует с энергией a(v,v), при- присущей задаче, то во многих случаях мы будем предпочитать ра- работать с матрицей жесткости: /С,й,= а(ф,-, щ). Обе матрицы эр- эрмитовы и положительно определены. В качестве первой меры независимости базиса мы предла- предлагаем число обусловленности Если бы базис был ортонормальным, то матрида М была бы единичной и х= 1. Это не так для конечных элементов, но важно то, что на равномерной сетке базисные функции метода конечных элементов равномерно линейно независимы: %(М) -^ ^ const. Другими словами, все собственные значения матрицы М одного и того же порядка. Как заметил Шульц, при аппрокси- аппроксимации по методу наименьших квадратов (который есть не что иное, как метод Ритца, примененный к дифференциальному уравнению нулевого поряка и = f) кусочные полиномы значи- значительно более устойчивы, чем последовательность 1, х, у, х2, ... обычных полиномов. Число обусловленности матрицы массы, со- соответствующей этой последовательности и являющейся матри- матрицей Гильберта A.6), растет по экспоненциальному закону. Существуют приложения, в которых в качестве более реаль- реальной меры независимости можно взять оптимальное число обус- обусловленности с (М) = minx (DMD). D Здесь D — любая положительная диагональная матрица, соот- соответствующая изменению масштаба элементов базиса; с = 1, если исходный базис лишь ортогонален, но не ортонормален. При работе с нерегулярными элементами одни пробные функции мо- могут быть намного меньше других, и изменение масштаба может привести к значительному уменьшению числа обусловленности. Мы смотрим на изменение масштаба так: если число обуслов- обусловленности для М или К улучшается при изменении масштаба, это позволяет предположить, что численные трудности, которые тем самым устраняются, вероятно, никогда не распространяются на всю задачу. Изменение масштаба устраняет локальные трудно- трудности; если конкретная функция ср3- плоха из-за масштаба, так что, например, диагональный элемент Кц слишком мал, то ошибки округления разрушат доверие к вычисленному значению весового

8.1. НЕЗАВИСИМОСТЬ БАЗИСА 241 коэффициента Qj. Измеряемый эффект зависит от выбора нор- нормы; так как функция ф3 мала, такая ошибка округления не бу- будет означать большой ошибки в энергии, но в узле z3 аппрокси- аппроксимация может быть сравнительно плохой. Обычное правило при масштабировании разреженных поло- положительно определенных матриц заключается в том, что все ди- диагональные элементы должны быть одинаковыми: в случае ко- конечных элементов, в первую очередь регулируемом матрицей жесткости, это означает, что энергии деформации Кц в элемен- элементах базиса равны. Это правило дает диагональную масштаби- масштабирующую матрицу D, которая почти оптимальна [ШЗ]. Вопрос масштабирования возникает даже в случае равномерной сетки для конечных элементов эрмитова типа, когда среди неизвест- неизвестных Qj появляются как значения функции, так и производные. Возможно, естественная процедура состоит в том, чтобы неиз- неизвестные сохраняли правильные размерности за счет вращения Q = hv'jy а не 8 = 0,. Фрид [Ф16] заметил, что в одних задачах можно с успехом изменять масштаб, а в других — нельзя. Возьмем, например, двухточечную краевую задачу — и" = / с кусочно линейными элементами. Если все подынтервалы имеют длину h, за исклю- исключением первого, у которого она равна h/c, то матрицы жесткости при естественном краевом условии м'@) = 0 или главном уело вии м@) =0 пропорциональны соответственно матрицам *ест = 1 " ' ' Г I I ИЛИ Наибольшее собственное значение растет с ростом с, тогда как наименьшее имеет обычный порядок N~2, где N — порядок мат- матрицы. Поэтому обусловленность ухудшается при с-*-оо. Масштабирование приводит к тому, что все диагональные элементы становятся равными 2, а нижний конец матриц не изменяется: 2 — 2 Ус/1 + с — У2/1 + с D/СестО = | - 2 Ус/1 + с 2 2 - У2/1 + с -1 2 — у 2/1 + с DKrmBD=\ - д/2/1 + с 2 -1

242 5. устойчивость Наибольшие собственные значения теперь ограничены; трудный вопрос всегда — величина ^min- В рассматриваемом случае вто- вторая матрица не доставляет хлопот: с очень слабо влияет на зна- значение X,mm, которое снова оказывается порядка jV~2. Однако пер- первая матрица начинается с блока порядка 2, который при боль- больших с почти вырожден, и наименьшее собственное значение всей матрицы обязательно меньше собственных значений этого блока. Таким образом, X,min-»-0 при с-*-оо. Итак, изменение масштаба успешно при главном краевом условии, но не при естественном. Это численный аналог хорошо изученной физической ситуа- ситуации: жесткая система, соединенная с землей посредством мяг- мягкой пружины, чрезвычайно неустойчива, в то время как непод- неподвижное соединение (главное условие) дает устойчивую систему. Следует подчеркнуть, что в то время, как плохую обусловлен- обусловленность, связанную с числами, можно предвидеть, а вырождение элементов можно избежать, возникающую физическую плохую обусловленность нельзя обойти, разве лишь заменяя метод жест- костей на метод сил с напряжениями в качестве неизвестных. Эта ситуация встречается при резком изменении жесткости сре- среды или когда коэффициент Пуассона приближается к пределу несжимаемости v = '/г [Ф17]. Для оболочек трудности связаны с большой жесткостью в направлении толщины или с очень тон- тонкими оболочками. Грубо говоря, пространственные гармоники могут включать в себя отношение (гЦКJ [20], в то время как гармоники изгиба выявляют четвертый порядок задачи и округ- округление пропорционально hr*. Чтобы закончить это введение, мы должны разъяснить связь между числом обусловленности матрицы и ее чувствительностью к возмущениям. Крайний случай возникает, когда вектор на- нагрузки F в заданной линейной системе KQ = F совпадает с еди- единичным собственным вектором матрицы К, в частности с соб- собственным вектором Fmax, соответствующим Ххаах- Тогда реше- решением системы будет Q = FmaxAmax- Предположим, что вектор нагрузки слегка возмущен другим собственным вектором Fmin, соответствующим Kmin, так что F= Fmax + eFmin- Тогда решение принимает вид Q — FmaxAmax + eFminAmin. Поэтому относитель- относительное изменение в решении равно I Q I Таким образом, возмущение в F порядка е дает возмущение в Q порядка ке. Легко заметить, что этот случай крайний и что всегда \Р\

В.2. ЧИСЛО ОБУСЛОВЛЕННОСТИ 243 Д о к а з а т е л ь с т в о. | f | = | /CQ К bmax I Q I и | в/* | = | /CflQ I > Из этого простого неравенства и подобного ему неравенства с |б/С|/|/С| в правой части (см. [20]) вытекают далеко идущие следствия. Если число обусловленности к порядка 10~s, то в ре- решении уравнения KQ = F можно потерять до s значащих цифр. Если это близко к числу точных знаков в вычислениях на ЭВМ, то для достижения нужной точности вычислений может потребоваться двойная точность расчетов на ЭВМ. Было высказано возражение, что в конкретной задаче число обусловленности может не иметь ничего общего с вектором на- нагрузки. Постоянная к может, а на самом деле должна быть по крайней мере отчасти пессимистична. Айронс [А2] предложил не- несколько разных чисел, которые в процессе, исключения форми- формировались в машине и которые автоматически учитывали масшта- масштабирование и значение f данной задачи. Мы допускаем, что для немедленного принятия решений (окончание особых вычислений или переход к двойной точности) вычисляемые величины такого рода будут наилучшими. Однако наша цель здесь состоит в оты- отыскании некоторой априорной меры чувствительности, и число обусловленности для этого вполне удовлетворительно. Правило, к которому оно приводит, а именно что ошибка округления бу- будет увеличиваться пропорционально h-2m, в обычных вычисле- вычислениях определенно выполняется. Мы подчеркиваем, что здесь нет зависимости от общего числа элементов в области, а есть зави- зависимость от числа элементов на каждой стороне. Другими сло- словами, нет существенной зависимости от числа пространственных переменных. 5.2. ЧИСЛО ОБУСЛОВЛЕННОСТИ Наша цель — оценить отношение к = Xn (К) Ih (К) наиболь- наибольшего к наименьшему собственному значению матрицы жесткости. Теорема 5.1. Для каждой вариационной задачи и каждого вы- выбора конечного элемента существует такая постоянная с, что х<сА^Г. ' A) Постоянная обратно пропорциональна наименьшему собствен- собственному значению К\ заданной непрерывной задачи и увеличивает- увеличивается, если геометрия элементов становится вырожденной. Дадим два корректных, но довольно неформальных доказа- доказательства. Первое применяется лишь к специальному случаю рав- равномерной сетки и иллюстрирует, как анализ Фурье (или Тёп- лица) позволяет вполне точно вычислить собственные значения

244 5. УСТОЙЧИВОСТЬ и число обусловленности. рторое применяется к конечным эле- элементам произвольной формы. Начнем с предположения, что сетка равномерна и коэффи- коэффициенты данной задачи Lu =.f постоянны. Матрицы жесткости элементов kit а также матрицы массы т,- все будут одинаковы. Это означает, что по существу К и М — тёплицевы матрицы. Эле- Элементы тёплицевой матрицы постоянны вдоль каждой диагонали. Kij зависит только от разности / — i номеров столбца и строки. (В непрерывном случае это соответствует интегральному опера- оператору \K(s — t)f(t)dt, т. е. свертке, ядро которого зависит лишь от s — t.) Хотя это свойство может теряться на границах, осо- особенно с естественными краевыми условиями, мы хотим показать, как все же полезны и легки вычисления с тёплицевыми матри- матрицами. Предположим, сравниваются две матрицы жесткости, обе возникающие из уравнения —и" = f при кусочно линейных эле- элементах. Первая имеет порядок N и подчиняется условиям и@) =и'(л).= 0; это основной пример на протяжении всей книги. Вторая соответствует случаю полного отсутствия границ, т. е. когда интервал [0, я] расширяется до (— оо, оо) в результате добавления еще и еще матриц элементов: 2 -1 2 1 2 -1 -1 1 -1 2 — 1 -1 2 -1 Так как К образуется из А'<х= (исключением всех элементов вне [О, я] и наложением главного условия Q0 = 0), то крайние соб- собственные значения матрицы К ограничены соответствующими собственными значениями матрицы /С»: AmIn (К J < AmIn (К) < Ятах (К) < Ягаах (KJ. То же справедливо и для матриц массы, так что линейную неза- независимость базиса можно проверить прежде всего на бесконечном интервале. С тёплицевой матрицей /(*,, которую можно описать как мат- матрицу дискретной свертки, работать просто. Точно так же, как собственные функции любого дифференциального уравнения с постоянными коэффициентами, ее собственные векторы яв- являются чистыми экспонентами. Возьмем вектор с компонентами Vj = е^'е и применим к нему матрицуг

5.2. ЧИСЛО ОБУСЛОВЛЕННОСТИ 245 Поэтому собственное значение равно (е + 2е)=, "Так как это число расположено между 0 и 4//г, то В этом случае результат совпадает с утверждением теоремы Гершгорина (\Л): каждое собственное значение" лежит в круге с центром в точке Ки = 2//г, радиус которого равен сумме 2j \ Kif\ = 2/h. в общем случае результат, полученный по тео- теореме Гершгорина, совсем не так хорош: даже для рассматри- рассматриваемых ниже билинейных элементов с внедиагональными эле- элементами одного и тогЪ же знака он неточен. Так же исследуются матрицы массы с элементами /г/6, 4/г/6, /г/6 вдоль каждой строки. Собственными значениями в случае бесконечного интервала будут ц(е) = -е-'е + —+ —e<e = _+_cose. Так как cosG изменяется от —1 до 1, то собственные значения матрицы Mo, заключены между /г/3 и /г. Отметим способ, кото- который в применении к матрицам массы дает лучший результат: получается не только правильная верхняя граница для наиболь- наибольшего собственного значения, но и хорошая нижняя граница для Amin(M)- Число обусловленности матрицы М очень точно за- задается соотношением Так как эта оценка не зависит от /г, то кусочно линейные функ- функции-крышки линейно независимы равномерно по /г-»-0. Нулевая нижняя граница для Kmtn(K) возникла из-за наличия у Ка> ну- нулевого собственного значения: постоянная функция удовлетво- удовлетворяет уравнению — и" = 0 на всей прямой и соответствует дис- дискретному собственному вектору (...111...), которого нет у конеч- конечной матрицы К только из-за главного краевого условия. Поэтому в конечном счете для достижения строгих оценок для %{К) при- приходится привлекать матрицы массы. Для того чтобы лучше понять структуру матрицы /(«,, рас- рассмотрим еще два примера. 1. Билинейные элементы на квадратной сетке для —Аи = f. Здесь в каждом узле одно неизвестное и типичная строка мат- матрицы К (умноженная на 3/г) состоит из 8 на главной диагонали

246 5. УСТОЙЧИВОСТЬ и —1 на восьми соседних Диагоналях. Уравнение KQ = F имеет вид где (/', k') означают восемь ближайших к (/, k) точек на квад-* ратной сетке. Собственные векторы и матрицы Кх снова являют- являются чистыми экспонентами, но теперь у них уже две частоты: компоненты вектора v равны vjh = ei^9+h4'\ Вычислим собствен- собственные значения: "ShK^Vjk = (8 — eie — е-'9 — el<s> — e~i(f — е1 О+ч» — _ e-i (9+ф) _ ei (9-ф) _ e-i F-ф)) у Крайние собственные значения определяются из условий мак- максимума и минимума выражения в скобках. Так как оно линейно относительно cos 0 и cos qp, то экстремум должен быть, когда cos-0 и cosqp равны ±1, так что Amin (KJ = 0, Лтах (KJ = ]| (при 0 = я, Ф = 0). Теорема Гершгорина дала бы Хтах ^ 16/3/г. 2. Кубические элементы в одномерном случае для uIY = f. Здесь в каждом узле уже два неизвестных и KQ = F — система двух разностных уравнений. Соответственно К и Ка> — блочные тёплицевы матрицы: вдоль главной диагонали расположен блок А размера 2X2, с одной стороны от него находится блок В того же размера, а с другой — транспонированный блок Вт. В соответствии с результатами разд. 1.7 Вт А В Вт А В 1 /24 0 \ j /— 12 6h \ A = ~W\0 8/i2J' B==W\-6h 2h2)- По аналогии с предыдущими примерами собственные значения можно вычислить из блока Щ) = BTe~ie + А + Beid. Это B X 2)- матрица; максимум ее собственных значений на всем отрезке —я ^ 0 ^ я совпадает с Хт&х(Коо). Крайний случай снова дол- должен быть при 0 = 0 или 0 = я, поскольку отношение Рэлея xTX(Q)x/xTx линейно по cos0. Подсчитываем 1/0 0 \ ,/48 U J l^ { 0 ,/

5.2. ЧИСЛО ОБУСЛОВЛЕННОСТИ 247 Итак, Ятах(-^ос) = птах A2//г, 48//г3). На этот результат может повлиять изменение относительного масштаба двух типов базис- базисных функций, соответствующих перемещению и наклону. Крайние собственные значения любого блока тёплицевой мат- матрицы Клс можно найти тем же способом. Если порядок блоков равен М (число неизвестных на квадрате сетки), то и X(Q) будет матрицей того же порядка, в n-мерной задаче 6= @ь ..., 6„). Так как в методе (узловых) конечных элементов каждый квад- квадрат связан только с ближайшими к нему, то матрица К будет линейной по cos 61, ..., cos6n. Поэтому Ътах(Коо) можно вычис- вычислить, пробуя все возможные комбинации ±1 для этих косинусов и определяя наибольшие собственные значения из 2™ получаю- получающихся в результате матриц X. Итак, работая только с матри- матрицами порядка М. (меньшего, чем у матриц элементов; для неко- некоторых элементов значение М приведено в таблицах в разд. 1.8), можно вычислить точно число обусловленности чистой тёплице- тёплицевой матрицы. Для матриц массы (также обозначаемых через М}) получаем к(М)^.к(Мсо), причем постоянная х(ЛО зависит только от элемента. Конечные элементы равномерно независимы. Для матриц жесткости есть хорошая верхняя граница зна- значения Типах, а нижней хорошей — нет. Здесь нам придется оста- оставить точные вычисления и вернуться к неравенствам/Согласно принципу Рэлея, наименьшее собственное значение матрицы К равно Я, (К) = min ^р- > min —- min -*-?*- = К{ (ЛГ'/О \ (М). B) XX X Мх XX С появлением М~1К легче использовать вариационные доказа- доказательства. Задача на собственные значения K.Q = XMQ есть в точности аналог непрерывной задачи Lu = Ки, решаемой мето- методом конечных элементов, и в гл. 6 мы показываем, что главное собственное значение К\ (М~1К) дискретной задачи всегда не меньше главного собственного значения Ki(L) непрерывной за- задачи. Это и есть нижняя граница, которая не зависит от /г. В примере Lu = —и" с краевыми условиями ы@) = и'(л) = = 0 наименьшее собственное значение равно 'м (L) = 'Д- Так как мы уже доказали, что Х1 (М) ^ Кх (М^) ^ /i/З, то отсюда сле- следует, что %\ (К) ^ /г/12. Наименьшее собственное значение мат- матрицы К равно sin2 (-jj/f—j, т. е. примерно /г/4. В оценке B) теряется множитель 3, по существу число обусловленности мат- матрицы М, так как истинный минимум отношения хтКх/хтх дости- достигается на основной гармонике х, компоненты которой все одного знака. Это соответствует более kmax(M), чем значению ?imin(M), возникающему в B).

248 5. устойчивость Однако существенно то, что показатель степени h в числе обусловленности определяется правильно: ../рл. WM ^ 4/А _ 48 К1Д;~ ^minUC) ^ Л/12 ~" Л2 ' Для уравнения порядка 2т на регулярной области тот же под- подход к тёплицевой матрице (вместе с B)) дает число обуслов- обусловленности порядка h~2m. Постоянная зде'сь, как и должно быть, включает в себя Ai(L); если физическая задача плохо обуслов- обусловлена, то это должно отражаться на ее аналоге в методе конеч- конечных элементов. Второе доказательство теоремы 5.1. Осталось лишь распространить оценку h~2m для числа обусловленности на случай нерегулярных элементов. Тёплицева структура пропадает, и все доказательство должно быть основано на матрицах от- отдельных элементов. Мы будем следовать Фриду [Ф13]. Чтобы найти верхнюю границу для Хтах(К), вспомним, что глобальная матрица жесткости составлена из матриц элементов k{: xTKx='ZxTikixr C) i Вектор х и матрица К имеют порядок Л", вектор я,- и матрица ki — порядок dit т. е. число степеней свободы внутри t-ro эле- элемента. Действительно, *, получается из х, если удалить все, кроме di соответствующих компонент; это можно представить себе как умножение вектора х на матрицу инциденций, состав- составленную соответствующим образом из 0 и 1. Если Л — максимальное из всех собственных значений мат^ риц жесткости элементов, так что, согласно принципу Рэлея, xTikjxi ^ AxTxt, то из C) вытекает, что Предположим теперь, что q — максимальное число элементов, «встречающихся» в любом узле. Тогда ни одна из компонент век- вектора х не входит более чем в q векторов Хи так что 'J^r^T Поэтому TK^ATи K Чтобы найти нижнюю границу для Vin(M)> рассуждаем точно так же, как раньше: хтМх = ? х\mixi ^ 0 2 xTixi ^ вгхтх, где 0 — наименьшее из собственных чисел матриц массы элемен- элементов, а г — минимальное число элементов, «встречающихся»

5.2. ЧИСЛО ОБУСЛОВЛЕННОСТИ 249 в узле. (Часто г = 1 или г = 2 из-за элементов на границе; ко- конечно, г= 1, если существуют узлы, внутренние по отношению к элементам.) Снова, согласно принципу Рэлея, X X Поэтому в силу B) число обусловленности матрицы жесткости ' меньше, чем (Ю Если геометрия элементов не вырождается, так что базис одно- однороден в смысле гл. 3, то непосредственное вычисление дает ожидаемое значение %(К) = O(h~2m). Если же вырождение про- происходит, например треугольники становятся очень тонкими или четырехугольники приближаются к треугольникам, оно отра- отражается на параметрах Л и 0. Так как это собственные значения матриц малого размера, то влияние вырождения можно строго оценить. Фрид [Ф13] вычислил эту зависимость от геометрии для нескольких примеров (оценка в теореме 5.1 иногда песси- пессимистична) и дал также нижнюю границу для числа обуслов- обусловленности. Он получил также красивую оценку в одномерном случае для неравномерных сеток, пользуясь неравенством a(uh, uh)^L ^La(u,u); дискретная структура всегда жестче непрерывной. Предположим, что в /-й узел помещена точечная нагрузка / = = б(х — Zj). Тогда, как отмечалось в разд. 1.10, у вектора на- нагрузки F только одна ненулевая компонента а (и*, uh) = QTKQ = FTK-lF = (K~1),,. Таким образом, величина (Д"~')я меньше истинной энергии а(и,и) и ограничена независимо от распределения узлов. (Мы предполагаем, что рассматривается задача ~(ри')' -\- qu = f и неизвестны значения функции.) Так как матрица К~1 положи- положительно определена и тем самым (,К~1У{!^(.К~1)и(.К~1I!, то ее наибольший элемент должен быть на главной диагонали. По- Поэтому сумма абсолютных значений элементов каждой ее строки ограничена величиной cN, где N — порядок матрицы. Можно взять ЛМ в качестве среднего значения шага сетки Я. Так как hi фигурирует в знаменателе в t'-й матрице элемента, то соответ- соответствующая сумма вдоль каждой строки матрицы К ограничена величиной c/hmixi- Следовательно, число обусловленности даже в более сильном смысле сумм абсолютных значений по строке (что соответствует поточечным, а не среднеквадратичным оцен- оценкам) меньше, чем С/й/tmin. Для равномерной сетки опять бу- будет C/h2.

250 5. УСТОЙЧИВОСТЬ Важный вывод: ошибка округления не зависит сильно от степени полиномиального элемента. Главным образом она зави- зависит от h, от порядка рассматриваемой задачи и от основного собственного значения непрерывной задачи. Поэтому при нали- наличии ошибок округления достичь численную точность можно, увеличивая степень пробных функций. Число обусловленности для кубических элементов лишь немного хуже, чем для линей- линейных, так что ошибки округления в этих случаях для заданного значения h сравнимы. Однако ошибка дискретизации для куби- кубических элементов на порядок меньше. Поэтому в переходный момент, когда округления не позволяют получать более точные результаты за счет уменьшения h, с помощью кубического эле- элемента этого можно достичь. Особенно это относится к вычисле- вычислению напряжений, где дифференцирование (или взятие разно- разностей) перемещений вводит в численную ошибку дополнительный множитель h~l. Даже в задачах второго порядка ошибка округ- округления становится значительной и наилучший выход из положе- положения— увеличить степень пробных функций.

ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ 6.1. ВАРИАЦИОННАЯ ФОРМУЛИРОВКА И ПРИНЦИП МИНИМАКСА Задачи на собственные значения, которые мы будем записы- записывать в виде Lu = Хи или, более общо, Lu = ХВи, очень часто встречаются в приложениях. Назовем здесь лишь задачи о про- продольном изгибе стержней и выпучивании оболочек, колебании упругих тел и о многогрупповой диффузии в ядерных реакто- реакторах. К счастью, как и для стационарных уравнений Lu = f, для этих задач также полезна идея Рэлея — Ритца. В самом деле, эта идея исходит из описания Рэлея основной частоты как наи- наименьшего значения отношения Рэлея. Поэтому шаг, который был предпринят в последние 15 лет, вполне еетествен и неизбе- неизбежен: применить новые идеи метода конечных элементов к этой давно установленной вариационной форме задачи на собствен- собственные значения. С практической точки зрения это означает, что кусочно полиномиальные функции можно подставить непосредственно в отношение Рэлея в качестве пробных функций. Вычисление этого отношения становится как раз той задачей, которая уже обсуждалась и для выполнения которой к настоящему времени создано множество мощных вычислительных машин. Эта задача представляет собой вычисление матриц жесткости и массы К и М. Следующий шаг, однако, приводит к другой, более трудной вычислительной задаче линейной алгебры: вместо решения ли- линейной системы KQ = F надо решить дискретную задачу на собственные значения KQ = XMQ. К счастью, сейчас известно, как можно использовать свойства этих двух матриц: симмет- симметричность, разреженность, положительную определенность мат- матрицы М, для ускорения численного алгоритма. В разд. 6.4 мы рассмотрим несколько эффективных численных методов'. С теоретической точки зрения, основные этапы в построении оценок погрешностей снова зависят от аппроксимирующих свойств подпространства метода конечных элементов Sh. Сле- Следовательно, здесь непосредственно можно применить теоремы аппроксимации из гл. 3. Математически новый необходимый шаг заключается в том, чтобы исходя из этих теорем аппрокси-

252 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ мации вывести удовлетворительные оценки ошибок в собствен- собственных значениях и собственных функциях. Этот шаг и является нашей основной целью. Прежде чем приступить к изложению общей теории, иссле- исследуем несколько специальных примеров, чтобы проиллюстриро- проиллюстрировать поведение аппроксимаций методом конечных элементов. Затем применим теорию аппроксимации к задаче на собствен- собственные значения и найдем границы для ошибок Х{ — Я,* и и[ — и\ в 1-й собственном значении и в 1-й собственной функции соот- соответственно, достаточно точные для того, чтобы правильно отра- отразить зависимость их от / и п. Начнем с задачи на собственные значения вида д(х)и = Хи, 0<х<п. A) Оператор L этой задачи изучался в гл. 1, его простота заклю- заключается в его одномерности. Продемонстрируем еще раз разли- различие между естественными и главными краевыми условиями, задав по одному из них: и@) = 0, и'{п)=*0. B) Известно, что такая задача Штурма — Лиувилля имеет бес- бесконечную последовательность вещественных собственных зна- значений ¦ %^X^ ^Xi^ ... ~*-оо и соответствующую полную систему ортонормальных собствен- собственных функций. я (и,, uk)=\juf(x)uk(x)dx = 6Jlt. C) о Отсюда немедленно вытекает, что эти собственные функции ор- ортогональны также и в смысле энергетического скалярного про- произведения: - (Luh uk) = (Xh uh «ft) = A,/6/ft, D) или, после интегрирования по частям, В случае постоянных р и q, который будет служить модельной задачей, графиками собственных функций служат синусоиды

6.1. ВАРИАЦИОННАЯ ФОРМУЛИРОВКА И ПРИНЦИП МИНИМАКСА 253 Первый шаг в методе Рэлея — Ритца состоит в том, чтобы переписать Lu = Хи как вариационную задачу. Есть две воз- возможности, соответствующие минимизации по Ритцу и слабой форме записи по Галёркину' стационарных уравнений Lu = f. Обе приводят к одному и тому же результату. Первая заклю- заключается в том, чтобы ввести отношение Рэлея в виде a(v v) Мы утверждаем, что стационарные (или критические) точки функционала R(v), т. е. точки, где градиент от R обращается в нуль, являются в точности собственными функциями задачи. Чтобы понять это, допустим, что пробная функция v заменена соответствующим разложением в ряд X &зи) по собственным функциям a.j — (v, Uj). Тогда, используя условия ортогонально- ортогональности C) и E), получаем В стационарной точке функционала R(v) производная по каж- каждой переменной ah должна равняться нулю: (Z «D2 _ л Если v — одна из собственных функций и3-, то это условие, не- несомненно, выполняется: aft = 0 для всех к, кроме k = /, а /-е слагаемое равно нулю, поскольку %$ — Xh = 0. Других стацио- стационарных точек, отличных от собственных функций, нет. (Для кратного собственного значения Я,,- = A,j+i все комбинации v = = ccjMj + otj+iMj+i будут собственными функциями и существует целая плоскость стационарных точек.) Значение R(v) в стацио- стационарной точке v = и, легко вычисляется: оно точно равно соб- собственному значению Ху. Полезно попытаться представить себе график R(v). Числи- Числитель a(v,v), как и для I(v) в гл. 1, соответствует выпуклой по- поверхности «рюмки для яйца», единственное отличие в том, что линейный член —2(f, v) теперь отсутствует, так что дно рюмки лежит в начале координат. Влияние знаменателя (и, у) можно исследовать двумя способами. Так как он делает отношение од- однородным, т. е. R(av) = R(v), то можно рассмотреть лишь еди-

254 6. ЗАДАЧИ НА СОБСТВЕННЫ^ ЗНАЧЕНИЯ ничные векторы и. Другими словами, можно положить знамена- знаменатель равным 1 и рассматривать сечение рюмки круговым цилин- цилиндром (v, v) = 1. Минимум на этом сечении соответствует основ- основной частоте Х\. Второй способ — положить числитель равным 1. Это озна- означает, что рюмка разрезается горизонтальной плоскостью, ле- лежащей на 1 выше основания. Поперечное сечение будет эллип- эллипсом a(v,v)=l, или точнее, бесконечномерным эллипсоидом у X,с(/= 1. Его главная ось расположена в направлении первой собственной функции «i, так как именно по этой оси эллипсоид наиболее вытянут. Другими словами, при фиксированном чис- числителе, равном 1, отношение Рэлея минимально, когда знамена- знаменатель максимален. Если затем рассмотреть эллипс, перпендику- перпендикулярный к этой главной оси, т. е. фиксировать а\ = О и получить пространство на единицу меньшей размерности, то длина глав- главной оси этого эллипса будет равна. У1/Я2- (И вообще длина главной оси любого другого поперечного сечения исходного эл- эллипсоида будет меньше длины главной оси эллипсоида ?а^ = 1, но больше д/1Л2> что соответствует, принципу ми- нимакса, описанному ниже в A3): наименьшее собственное зна- значение Я) при любом дополнительном условии удовлетворяет соотношению Я, ^ Х\ ^ Я2Л Оказывается, что для четырехмерного случая поперечное се- сечение рюмки для яйца есть оболочка всего яйца. До сих пор мы не уточняли, какие функции v допустимы в вариационной характеризации (т. е. в отношении Рэлея) соб- собственных значений и собственных функций. Это в точности тот же вопрос, что возникал в стационарной задаче в разд. 1.3. Там функционал I (v) в конце концов минимизировался по всем функциям из Ж}, удовлетворяющим главным' краевым усло- условиям, т. е. на пространстве ЖХЕ. Это пространство естественным образом появилось в процессе пополнения, который заклю- заключается в присоединении к множеству гладких функций, удов- удовлетворяющих всем краевым условиям, любой функции v, равной пределу функций vN из этого множества в смысле a(v — vN, v— Djv)->0. Так как этот процесс не изменяет поверх- поверхность R{v), то мы здесь будем выполнять ту же процедуру по- пополнения; все стационарные точки сохраняются. (И если бы функция р(х) была разрывной, этот процесс заполнения дыр на поверхности R(v) в действительности заполнял бы множество собственных функций: так как они не гладкие, то они первона- первоначально исключались.) В результате допустимым пространством, как и ранее, будет Жхе* Это означает, что для дискретной аппроксимации можно

6.1. ВАРИАЦИОННАЯ ФОРМУЛИРОВКА И ПРИНЦИП МИНИМАКСА 265 использовать все те же подпространства метода конечных эле- элементов с единственным отличием, что теперь мы ищем стацио- стационарные точки функционала R(v), а не минимум для I(v). Ранее упоминалось, что есть второй способ переформули- переформулировки задачи на собственные значения. Он состоит в том, чтобы записать уравнение Lu = Хи в его слабой форме, или форме Галёркина. Умножим Lu = Хи на функцию v и проинтегрируем по частям: я я 'v' jj (pu'v' + quv) dx = X jj uv dx. (9) о о Теперь задача на собственные значения заключается в том, чтобы найти скаляр X и функцию и е Же, при которых (9) вы- выполняется для всех v e Же- Краевые условия для и получаются правильными, так как уравнение (9) фактически- эквивалентно уравнению \ Lu\x) v(x)dx — pu'v —%\uvdx. При х = 0 проинтегрированный член pu'v автоматически обра- обращается в нуль. Из равенства, содержащего остальные члены, в силу произвольности выбора v в ЖЕ вытекает, что естествен- естественное условие и' = 0 при х = п выполняется и на всем интервале функция и подчиняется дифференциальному уравнению Lu=Xu. Уравнение (9) представляет собой частный случай обычной слабой формы задачи на собственные значения: найти скаляр X и функцию и в допустимом пространстве V, при которых а(и, v) = X(u, v) для всех v в V. A0) Это соотношение похоже на условие a(u,v) — (f,v) обраще- обращения в нуль первой вариации в стационарной задаче минимиза- минимизации I(v). Действительно, это уравнение означает обращение в нуль первой вариации от R в стационарной точке и: iu | е.л — а(и + e,v, и + во) __ а (и, и) + 2га (и, у) ^ «) + 2е (и, о) + а (и, у) (и, и) — а (и, и) (и, у) 1— Таким образом, формулировка задачи в слабой форме и поста- постановка ее как задачи отыскания стационарных точек эквива- эквивалентны.

256 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ Для случая Xi и щ, т. е. для основной частоты и соответ- соответствующего ей собственного колебания, стационарная точка фактически является минимумом: Я,,= min R(v). A1) о в Э€1Е Это становится очевидным, если v представить в виде 2l ai^h так как тогда R (и) = X а/\/X а/s*5 V Полезно также описать собственные функции более высокого порядка исходя из минимизации, поскольку анализировать схо- сходимость к минимуму намного проще, чем к стационарной точке. Одна возможность в этом направлении — заставить функцию v быть ортогональной к первым 4—1 собственным функциям: <xi = (и, «i) = 0, ..., ai-i = (v, «;_i) = 0. При этих условиях ми- минимум отношения Рэлея равен Я,г: Xt= min R(v). A2) Здесь ?;_i — пространство, натянутое на собственные функции «ь .... мг-1- Есть другая формула для \и не требующая знания щ, ... ..., щ-\. Ее открыли Пуанкаре, Курант и Фишер. В дальней- дальнейшем нашем изложении она играет фундаментальную роль. Принцип минимакса: если R(v) максимизируется на 1-мер- 1-мерном подпространстве 5г, то Яг — наименьшее (при всевозможных наборах 1-мерных подпространств Si а Же) из наибольших зна- значений R(v), т. е. li = min max R (v). A3) Если 5; = Ei, то максимум R(v) в точности-равен Яг. Для доказательства формулы A3),надо показать, что для любого выбора подпространства Si A,z. A4) Рассуждение основано на выборе функции o*eS|, которая должна быть ортогональна к ?г_1, т. е. удовлетворять /—1 уравнениям (и, ы,) = 0, 1 ^ t </. Так как мы налагаем лишь /—1 однородных условий в пространстве с / параметрами, то такая функция v* существует. Поскольку и* X Zj;_i, из A2) вы- вытекает, что %i^.R(v*). Другими- словами, A4) выполняется и формула A3) справедлива. Из этой формулы сразу можно вывести грубую оценку для собственного значения Ki, сравнивая рассматриваемую задачу

6.1. ВАРИАЦИОННАЯ ФОРМУЛИРОВКА И ПРИНЦИП МИНИМАКСА 257 с задачей с постоянными коэффициентами. Ясно, что для любой функции v \ Ртах (V'f + <7maxf2 >\p(x) {v'f + q (х) V2 > $ Pmln {v'f + «7т1пЛ Разделим на \ и2. Легко видеть, что в центре стоит отношение Рэлея для задачи с переменными коэффициентами и оно за- заключено между отношениями Рэлея для задач, собственные значения которых известны в явном виде. По принципу мини- макса каждое собственное значение Xi рассматриваемой задачи должно лежать между двумя известными собственными зна- значениями: Ртах (f — "з") +q-max>h>Pmln(l — -2) + <7mln- A5) В частности, Kt при Z->oo имеет порядок I2. Наконец, мы подошли к главной цели этого раздела — уста- установить принцип Рэлея — Ритца для приближенного вычисления собственных значений. Можно начать либо с постановки задачи в слабой форме а(и, v) = K(u, и), либо с описания собственных значений как критических (стационарных) точек отношения R(v) = a(v, v)/(v, v). В любом случае идея состоит в том; чтобы работать в пределах конечномерного подпространства Sh из всего допустимого пространства Же- В этом подпространстве мы ищем такие Kh и м\ что a(uh, vh) = %h{uh, vh) для всех vh в Sh. A6) Другими словами, J р (х) (и*)' (vh)' + q (x) «V =.Kh J uhvh. Второй подход: приближенные собственные векторы являются критическими точками для R(vh) на Sh. Чтобы убедиться, что оба метода приводят к одним и тем же аппроксимациям, выберем в Sh базис фЬ ..., <pw. Тогда лю- любую функцию vh e Sh можно представить в виде fft=I<7/<P/. A7) где <7j — обобщенные координаты (узловые параметры функции vh, если Sh — пространство метода конечных элементов). Под- 9 Зак. 287

258 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ ставим в отношение Рэлея: Интегралы в числителе и знаменателе уже известны — это эле- элементы матрицы жесткости /С и матрицы массы Mh. Таким об- образом, отношение Рэлея выражается через вектор q= (<7ь... .... qN) формулой Критические точки этого дискретного отношения служат реше- решениями матричной задачи на собственные значения л Q =лМ Q . (zO) Это и есть та задача, которую надо решить. Можно ожидать, что собственные значения А* будут приближать А/ (по крайней мере для малых значений /), а собственные векторы Qf приве- приведут к соответствующим приближенным собственным функциям ¦ «?=fl(Q?)/«P/. B1) Таким образом, компоненты дискретных собственных векторов матричной задачи KQ = KMQ дают значения собственных функ- функций в узлах в методе конечных элементов. Слабая.форма задачи на собственные значения приводит не- непосредственно к тому же результату. Пусть в уравнении A6) vh = wh, тогда а это просто k-я строка матричного уравнения KhQh = %hMhQh. Если базисные функции ер,- ортонормальны, то матрица массы Mh будет единичной и дискретная задача состоит в оты- отыскании собственных значений матрицы Kh. Однако условие ор- ортогональности для cpj несовместимо с более важным свойством конечных элементов, а именно с тем, что функция ф3- должна равняться нулю на всех элементах, не содержащих узел z,. По- Поэтому мы должны либо принять Mh = /, либо нарушить идею Рэлея, допустив приближенный расчет масс. Мы предпочитаем первое, поскольку сейчас появляются численные алгоритмы ре- решения общей задачи на собственные значения KQ = XMQ, сравнимые по эффективности с алгоритмами для задачи KQ =

6.2. НЕСКОЛЬКО ПРОСТЫХ ПРИМЕРОВ 269 ~ = XQ. Подчеркнем, что матрица массы во всех случаях сим- симметрична и положительно определена; это матрица Грама для. линейно независимых векторов <рь ..., <р^. Во многих приложениях наиболее важна основная частота ki, и мы особенно надеемся, что A,f обеспечит хорошую ап- аппроксимацию для V Заметим, что так как А^ — наименьшее значение R{v) на подпространстве Sh, а К\ — минимум на всем допустимом пространстве ЖХе, то всегда Я,?^Я,1. Естественно ожидать, что если истинную собственную функцию щ можно хорошо аппроксимировать в подпространстве Sh, то %\ будет автоматически близко к %\\ это будет основной результат теории. Принцип минимакса с одинаковым успехом применяется к дискретной задаче (с тем же доказательством), так что при- приближенные собственные значения можно охарактеризовать фор- формулой . Af=minmax/?(uft). B2) Здесь Si пробегает последовательность всевозможных 1-мерных подпространств пространства Sh. Конечно, определение имеет смысл только при l^N, так как если N — размерность про- пространства Sh, то существует всего лишь N приближенных соб- собственных" значений. Сравнивая принципы минимакса B2) и A3), сразу видим, что каждое собственное значение %i оцени- оценивается сверху: Ц>^1 для всех /. B3) Каждое пространство 5г, рассматриваемое при минимизации в B2), также допускается ив A3), так что значение Я.;, (мини- (минимум в A3)) по крайней мере так же мало, как и Я,?. Принцип минимакса без изменений распространяется на случай Lu — %Bu, где В — положительно определенный опера- оператор; отношением Рэлея здесь будет R(v) = (Lv,v)/(Bv,v). Мат- ~ рица массы дискретной задачи принимает вид Mih = E<pj, щ). 6.2. НЕСКОЛЬКО ПРОСТЫХ ПРИМЕРОВ В этом разделе мы рассмотрим несколько специальных при- примеров из тех, что встречаются в общей теории аппроксимации собственных значений. В основном займемся задачей с постоян-- ными коэффициентами с краевыми условиями и ==0, и'(л) = 0, 9'"

260 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ В качестве первого пробного пространства возьмем про- пространство кусочно линейных функций с равномерно располо- расположенными узлами Xj = jh. Если базис образован обычными функциями-крышками ф;-, то основные матрицы такрвы: 1 4 <l —~h 2 -1 -1 2 -1 -1 2 , 1 — 1 1 Матрицу жесткости можно записать в виде K.h = рКл + qMh. Оптимальные весовые коэффициенты для собственной функции Z отыскиваемой по принципу Рэлея — Ритца, совпадают со значе- значениями uh в узлах, и система KhQh = %hMhQh представляет со- собой не что иное, как разностное уравнение ^(^ / /) . B4) Чтобы это уравнение было справедливо в граничной точке / = N, положим Q^+i=Q^-i- Вспомним, что условие Дирихле ц@) = 0 дает Qo = 0. Система B4) без краевых уравнений имеет тёплицеву струк- структуру в'том смысле, что (t,/)-e элементы матриц жесткости и массы зависят лишь от разности i — j. Поэтому разумн.о ожи- ожидать, что собственные векторы будут тригонометрическими и на самом деле компоненты 1-го собственного вектора равны Для того чтобы выписать выражение для соответствующего собственного значения Я,/} обозначим Тогда h _ pkn (I) + qmh (I) B5)

6.2. НЕСКОЛЬКО ПРОСТЫХ ПРИМЕРОВ 261 В этой частной задаче собственные функции щ совпадают в уз- узлах со своими приближениями и?'- и? (/А) = Щ (/А) = д/f sin ([l -1) /Л). B6) Отсюда следует, что функция «? равна интерполянту для ыг и, согласно теоремам об аппроксимации, ")• B7) Хотя точность в узлах собственных функций w? в методе Ритца специфична, оценка B7) характерна и для общего случая. Ошибки в собственных функциях и1 — и*[ в методе Ритца того же порядка, что и ошибки приближенного решения стационар- стационарных задач Lu = f. Вернемся к приближенным собственным значениям Я,? (фор- (формула B5)). Разложим в ряд введенные выше функции kh{l) и mh(l): Вспоминая, что Xi = p(l— lhJ + Q, запишем ошибку в соб- собственном значении в виде Я? = Я, + h2 ? {l - iL + О (W) = Я,, + О (Л2/*). B8) Заметим, что точность собственных значений та же, что и у энер- энергии в собственных функциях. Это утверждение справедливо и в общем случае: t для задачи 2т-го порядка. Причина в том, что около критиче- критической точки график отношения Рэлея R(v) как функции от v плоский. Поэтому умеренно точные пробные функции дают очень точные приближения к собственным значениям. Собственные значения фактически не зависят от постоянной <7, так как добавление к оператору члена qu просто сдвигает спектр на постоянную величину fa = p(l—V2J при q = 0 и Xi — p(l—'/2J + ^ в общем случае. Решающий момент здесь — тот же эффект в аппроксимации Я,? по Ритцу — Галёр- кину. Удобно использовать инвариантность ошибки Я,?—h от- относительно q и гарантировать на протяжении всей главы, что %i > 0, добавляя к оператору, если, необходимо, достаточно большую постоянную.

262 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ При приближенном расчете матрица массы Mh заменяется диагональной, в рассматриваемом простом случае — единичной матрицей /. Оказывается, в нашем примере собственные функ- функции от этого не меняются. Напротив, собственные значения за- заменяются на 11 = pkh (I) + q = h - S^. (l - If + О {№). B9) Таким образом, Я? — нижняя граница для %i и ее точность того же порядка О(/г2), что и для Я/. Приближенный расчет Mh допускает ясную физическую ин- интерпретацию на языке жесткости системы KhQh = XhMhQh. С этой точки зрения замена матрицы массы Mh единичной мат- матрицей / делает систему «мягче» и, значит, уменьшает величины приближенных .собственных значений. Так как аппроксимации по Рэлею — Ритцу Л? всегда служат верхними границами для %и т. е. Я?;>Яь то можно надеяться, что уменьшение величины Я? будет увеличивать точность аппроксимации. С другой сто- стороны, такое нарушение правил Ритца может, на наш взгляд, сделать систему слишком мягкой и тем самым неблагоприятно отразиться на точности результатов. В рассматриваемой задаче ущерб был небольшим, но на более типичном примере в конце этого раздела мы покажем, что возможна значительно более серьезная потеря точности. Исследуем пример кусочно полиномиальной аппроксимации более высокой степени, а именно возьмем кубическое эрмитово пространство Sh на равномерной сетке. Здесь базисные функ- функции соответствуют значениям функции, а со,- — значениям ее производной, так что1) ЛГ-1 {х) + Е "/'«>/ (*). Матричная задача на собственные значения для отыскания» оптимальных весовых коэффициентов при р=\, q = 0 прини- принимает вид " IQ,,' ..' ..' \ 1 __ _ E2«/ + 9«/+I + 9m/-,) --??-(„;+1 _ „;_,) |, C0) 30 ') Ради простоты мы будем требовать, чтобы все функции vh e Sh удо- удовлетворяли как главному краевому условию в точке х = 0, так и естествен- рому услрвию при х = ц, ' i

6.2. НЕСКОЛЬКО ПРОСТЫХ ПРИМЕРОВ 263 Строго говоря, C0) и C1) выполняются только для 1 ^ / ^ ^ N—1, но эти уравнения справедливы и для граничных то- точек, если положить "О = «-! + «! = "',-"'-, = U'N = U'N+l-\-u'N_1 =UN+1~UN_1 = 0. (Заметим, что уравнение C0) сводится к равенству 0 = 0 при / = 0, а C1) —при j = N.) Оказывается, что как и в кусочно линейном случае, прибли- приближенные собственные функции этой простой задачи совпадают в узлах с тригонометрическими полиномами: Действительно, подставив C2) в C0)—C1) и обозначив v;= = I — 7г, получим задачу на собственные значения размера 2X2: •2,, ,_ч sinv,A i — sinv,/* h ¦jg- D — cos \ih 4rE2+18cosv^) Ji- Заметим, что C3) дает для каждого целого числа I <t N два собственных значения Л* 0 и Л*1. Так как система C0) — C1) имеет порядок 2N — 2, то они обязательно будут собственными значениями задачи в методе конечных элементов. Непосред- Непосредственным вычислением находим tf.o=h + 0(fh6). , C4) Порядок ошибки для s-й производной от соответствующей соб- собственной функции равен /4A4~S. Порядок остальных собственных значений A?, i есть О(/г~2), и онм не приближают никакое собственное значение дифферен- дифференциального уравнения. На первый взгляд это кажется серьезным препятствием к применению кубических эрмитовых элементов для вычисления собственных значений, поскольку по крайней мере половина собственных значений матричной задачи совер- совершенно бесполезна при аппроксимации. Однако это явление до-

264 6- ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ вольно типично для аппроксимаций методом конечных элемен- элементов. Более пристальное рассмотрение даже кусочно линейных приближений показывает, что для каждого числа h найдется такое целое число lh, что годятся лишь первые lh собственных значений; более того, Мд->-0 при h-+0. Это имеет важное зна- значение при выборе метода решения задачи KQ = XMQ: нужно вычислять только главные собственные значения. Закончим этот раздел замечанием о том, что «приближен- «приближенный расчет» матрицы Mh может привести к серьезным потерям точности [Т9]. Например, типичный подход — заменить в C0) выражения на щ и 0 соответственно ив C1) ж (8ы; - зы;+1 - 3m/'-i)' ш ("/-и -"/-.) на м^/210 и 0. Это приведет к задаче KQ = XQ, более простой, поскольку М заменится единичной матрицей. Однако прямое вычисление показывает, что ошибка собственных значений по- порядка O(h6) увеличится тогда до O(h2). 6.3. ОШИБКИ В СОБСТВЕННЫХ ЗНАЧЕНИЯХ И СОБСТВЕННЫХ ФУНКЦИЯХ В этом разделе мы изложим общую теорию аппроксимации по Рэлею — Ритцу в применении к эллиптическим задачам на собственные значения Lu = Хи. Постановка задачи хорошо из- известна: интегрирование по частям преобразует (Lv,v) в сим- симметричную форму a{v, v), определенную для всех v из простран- пространства допустимых функций Ж™. Собственными функциями будут точки Щ, в которых отношение Рэлея R(v) = a(v, v)/(v, v) ста- стационарно, а соответствующими собственными значениями будут %i = R{ui). Собственные функции ортогональны, и в силу сим- симметричности оператора L собственные значения вещественны. На подпространстве Sh отношение Рэлея принимает вид и стационарные точки Q дают приближение для и? и Я?. Эти точки определяются матричной задачей на собственные значе- значения KQ=XhMQ, и любые два собственных вектора Q{ и Q; удовлетворяют обычным соотношениям ортогональности: = Ц6,Г C5)

6.3. ОШИБКИ В СОБСТВЕННЫХ ЗНАЧЕНИЯХ И ФУНКЦИЯХ 265 В терминах собственных функций и1} = ? (QX ф; и uf = ? (QA q^ это означает, что (и*, uf) = bH, а (и*, "?) = ^6(.г C6) Таким образом, приближения отражают основные свойства точных решений. Для них также справедлив принцип мини- макса: / Ун = min max R {v ), C7) где Si — любое /-мерное подпространство. Рассмотрим сначала оценки для собственных значений. Пусть Р — проектор Рэлея — Ритца, определенный следующим образом: если функция и принадлежит Ж™, то Ри — составляю- составляющая в подпространстве Sh (относительно энергетического ска- скалярного произведения): а {и — Ри, vh) = 0 для всех vh e= Sh. C8) Это означает, что в энергетической норме a(v,v) функция Ри — ближайшая в Sh к заданной функции и. Другими словами, если бы и было решением стационарной задачи Lu = f, то Ри было бы в точности его аппроксимацией uh по методу Ритца. Вместе с нашим предыдущим результатом по аппроксимации (тео- (теорема 3.7) это гарантирует, что || и — Ри II, < С \hk~s + W- <*-т>] || и И,. C9) Мы будем оценивать Я? — Яг так: обозначим через Ех под- подпространство, натянутое на точные собственные функции щ, ... ..., щ, и возьмем Si = PEi в качестве подпространства в Sh, используемого в принципе минимакса. Таким образом, 5/ натя- натягивается на пробные функции Рщ, ..., Put. Они не совпадают тождественно с приближенными собственными функциями и1}, ..., u'l, но в доказательстве важно лишь, что они близки к последним. Лемма 6.1. Пусть ех — множество единичных векторов "в Ех и of = ma х | 2 {и, и — Ри) — {и — Ри,и — Ри) |. D0) 8е е i . Тогда при условии о^ < 1 приближенные собственные значения ограничены сверху: *¦» < т-Ьг- Dl)

266 «• ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ Доказательство. Чтобы применить принцип минимакса, надо быть уверенным, что подпространство Si = PEt Z-мерно. Ясно, что Ei само Z-мерно, так что вопрос сводится к следую- следующему: может ли равенство Ри* = О выполняться для ненуле- ненулевого вектора и*^Е{> Нормализуем вектор и* так," чтобы он был единичным, т. е. принадлежал ег. Тогда равенство Ри* = 0 озна- означает, что с* > | 2 (и*, и*- Ри*) - {и* - Ри*, и— Ри*) | = | (и*, и*)\=1. Так как это противоречит условию <т? < 1, то Si должно быть /-мерным. Теперь из принципа минимакса C7) получаем Я?< max R(v») = max^g^. oheSl use, (Pu,Pu) Поскольку P — проектор в энергетической норме1), числи- числитель здесь ограничен сверху: а(Ри,Ри)^.а(щи). Знаменатель ограничен снизу: - (Ри, Ри) = {и, и) —2{и, и — Ри) + (u — Pu,u Поэтому и лемма доказана. Теперь задача — оценить of, для этого нам понадобится одно тождество. Лемма 6.2. Если и = Щс1и1 принадлежит ер то (и, и — Ри) = X с Аг ха [щ — Рщ ,и — Ри). D2) Доказательство. Так как щ —-истинная собственная функция, то в силу A0) [щ, и — Ри) = %Т1а (и,, и — Ри). Кроме того, если в определении C8) проектора Р положить vh = Рщ, то а(Рщ, и — Ри) = 0. Вычитая, получаем (щ, и — Ри) = КТ{а{щ — Рщ, и — Ри). ') Из теоремы 1.1 следует (и легко вывести непосредственно), что a (v, v) =-a (Pv, Pv) — 2a(v— Pv, Pv) + a (v — Pv, v — Pv). Последнее слагаемое неотрицательно, а предпоследнее по определению C8) проектора Р равно нулю.

6.3. ОШИБКИ В СОБСТВЕННЫХ ЗНАЧЕНИЯХ Я ФУНКЦИЯХ 267' Умножив последнее равенство ва ct. н просуммировав по i, при- придем к D2). Теперь найдем основную оценку ошибок в собственных зна- значениях. -Теорема 6.1. Если Sh — пространство метода конечных эле- элементов степени k—1, то существует такая постоянная б, что для малых h приближенные собственные значения ограничены: h < Я? < Л, + 2 bh2(k~m)%kilm. D3) Это согласуется с явными оценками B8) и C4) для линейных и кубических элементов в одномерном случае. Доказательство. Мы хотим оценить о1}. Так как | a (v, w) |^ К\\ v \\m|| w \\m, то для первого слагаемого в а? имеем i 2\{и,и — Ри)\ = i l a {щ —-Pui, и — Ри) Применим теорему аппроксимации: i (,2(ft-m) - Р)и\ 1 life -,/ь2(*-т)|| у /,л<*/2т>-1„.11 у CjA(fe/2m)«i <C7i2(ft~m)Aift/m>~1. D4) ' llo"""" Так как 2с2=1, то эти соотношения справедливы для всех функций u=^?Jciui из ef, крайний случай возникает при ci= 1, поскольку этот коэффициент умножается на степень наиболь- наибольшего из собственных значений Я;. Предпоследний шаг при вы- выводе D4) был более тонкий; здесь потребовалось неравенство \\v\\h ^ с ||Lft/2my||0. Для k = m это не что иное, как условие эл- эллиптичности || v Ц2, ^ с2а (v, v), и выполняется оно для всех&, если коэффициенты дифференциального оператора L гладкие. Другой член в о1} более высокого порядка относительно h, так как в силу теоремы аппроксимации при s = О Поэтому, если заменить постоянную С в D4) большей постоян- постоянной б, то результат будет превышать о^ для всех малых h. Если теперь взять h достаточно малым для того, чтобы обеспечить о* < 1/2, то Я* < h A - а?) ' < Я., A + 2а?) < А., + 2 6Л2(*-т>Я?/т. Теорема доказана.

268 6- ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ Подобные оценки ошибок в методе Рэлея — Ритца имеют длинную историю, особенно в советской научной литературе. Вайникко [9] дал весьма завершенную теорию, включающую оценки ошибок в собственных значениях и собственных функциях даже для несамосопряженных случаев.. Вместе с теоремами об аппроксимации для метода конечных элементов его анализ при- приводит к оценкам, доказанным выше с помощью принципа мини- макса для самосопряженных задач. Этот принцип можно заме- заменить интегрированием по контуру в комплексной плоскости, а затем применить оценки Галёркина для стационарных задач (разд. 2.3). Интеграл от (L — zI)-1 вдоль контура"вокруг истин- истинного собственного значения Яг равен точно 2niuju[; Брамбл и Осборн [Б25], а также Бабушка и Фикс вычислили ошибку, воз- возникающую, если применить здесь метод конечных элементов. Метод минимакса, который мы выбрали для самосопряжен- самосопряженных задач из-за его простотц, применялся рядом авторов при исследовании конечных элементов; основные ссылки приведены в [Б 15]. Мы привели более аккуратное доказательство для того, чтобы определить не только степень /i2(fe-m), но также и правиль- правильную зависимость от /: Последний множитель означает, что гораздо труднее вычислять собственные значения более высоких порядков. Это утверждение проверено экспериментально и появление множителя A/ m под- подтверждено описанными в [К14] вычислениями, в которых исполь- использовались элементы пятой степени (они будут рассматриваться в разд. 8.4 при вычислении собственных значений L-образной мембраны), и следующими численными результатами, взятыми из [ЛЗ]. При расчете квадратной пластины были применены би- бикубические .эрмитовы элементы. Пластина подпиралась либо на всех сторонах (SSSS), либо только на двух, а другие две оста- оставались свободными (SFSF); для каждой стороны берется 10 элементов (рис. 6.1). Так как k = 4 и m = 2, то, согласно теоретическим результатам, относительная ошибка равна <**-¦ Обобщенная задача на собственные значения Lu = КВи иссле- исследуется точно так же. Предположим, что В — симметричный опе- оператор порядка 2т' < 2т, соответствующий квадратичной форме (Bv, v) = b(v, v). Тогда истинное отношение Рэлея есть R(v) = =za(v,v)/b-(v,v), а дискретное имеет вид qTKqlqTMbq, где мат- матрица массы Мь построена относительно нового скалярного про-

6.3. ОШИБКИ В СОБСТВЕННЫХ ЗНАЧЕНИЯХ И ФУНКЦИЯХ 269 изведения: (Mb)jh = b(q>j, щ). Изменяется только последний член в oht, для которого оценка D5) в 0-норме заменяется на Ь{и-Ри,и- Ри) < С2 [Л*»' + Л2«*-»)]21| и II2. Однако преобладает по величине первый член в of, а именно 2Ь (и, и — Ри) ~ h2(-h-m\ так что окончательная оценка в теореме не меняется. 13 Рис. 6.1. Ошибки собственных значений более высоких порядков для квадратной пла- пластины. О — SFSF, Д —SSSS. Влияние на вычисляемые собственные значения других при-' ближений — изменение области или коэффициентов, численные квадратуры, несогласованность элементов — сравнимо в методе конечных элементов с влиянием этих возмущений на энергию в стационарных задачах. Предупреждаем лишь, что при замене об- области Q многоугольником Qft ошибка в энергии должна изме- измеряться на Q. Поэтому ее порядок уже не O(h3), как было уста- установлено в разд. 4.4 на многоугольнике:' если все пробные функ- функции равны нулю на fi — Q\ то энергия по этой области пол- полностью теряется; соответствующее возмущение, пропорциональ- пропорциональное площади этой подобласти, есть О (К1). Займемся собственными функциями. Хорошо было бы дока- доказать, что их ошибки той же величины, что и в стационарных за- задачах Lu = /. Следует, конечно, ожидать, что появится некото- некоторая зависимость от / и точность для собственных функций более

270 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ высоких порядков ухудшится. Наши рассуждения будут техни- технически сложнее и снова будут опираться на два простых тожде- тождества, доказываемых в следующих леммах.. Лемма 6.3. При нормировке (м,, м,) = {uhu uf) = 1 а (и,- ы*. и, - и]) = \ | ut - и? | + Я.* - А.,. D6) Доказательство. Заметим, что а (и, - и?, щ - и*) = а (м„ и,) - 2а (и„ и*) + а (и* и*) = = ^-2^(MjlM?) + ^ = = Я, [2.-2 («„„*)] + **-*,. Величина в квадратных скобках равна 2 - 2 (И/, и*) = (И/, И/) - 2 (и„ и*) + (и*, «*)•= ||и, - и* |, так что тождество D6) доказано. Теперь, когда доказано тождество D6), а еще раньше най- найдены оценки для У§ — Яг> осталось лишь оценить ошибку соб- собственной функции в норме | м, — "?||0*. тогда ошибка в энергии бу- будет непосредственно вытекать из полученных результатов. Лемма 6.4. Для всех j и I ^-Х^щ-Ри^иЧ). D7) Доказательство. Так как член — \1(Ри1, «^фигурирует в обеих частях тождества D7), достаточно показать, что Так как и1} и и[ — собственные функции, обе части последнего равенства можно переписать в виде a (Pult ufy и а (м„ ы^) соответственно. Доказываемое равенство вытекает из определе- определения C8) проектора Р. Выражение D7) сходно с ошибкой отсечения в уравнении задачи на собственные значения; оно совпадает с а (Ри1г инЛ — Я(Р*) () Множество и^, ..., uhN образует ортогональный базис в Sh и, в частности, ^i = ?(J4.«M- D8)

6.3. ОШИБКИ В СОБСТВЕННЫХ ЗНАЧЕНИЯХ И ФУНКЦИЯХ 271 Тождества D7) и D8) можно интерпретировать так: из D7) видно, что коэффициент (Pu[t ы^) мал, если "к* не близко к А,;, а тогда из D8) следует, что Рщ близко к и1}. Это будет на- нашей стратегией при оценивании itf — Ри1 (а значит, и tf — и,), но чтобы процесс был' строгим, удобно рассмотреть отдельно случаи различных и кратных собственных значений. Если %i отлично от других собственных значений, то, согласно оценкам D3), найдется такая постоянная р, что для малых h ¦ .а '. I <Р Для всех /• D9) IА/ -Н\ Теперь приступим к вычислениям. Обозначим через р ведущий коэффициент (Pult uf\ в D8) и оценим остальные члены 1Ф1 (здесь учтено, что квадрат нормы равен сумме квадратов ком- компонент). Итак, получили основную оценку: Ошибка собственной функции оценивается теперь через ошибку аппроксимации по Ритцу щ — Рщ; из C9) вытекает E2) Это существенная часть нашей теоремы. Теорема 6.2. Если Sh — пространство метода конечных эле- элементов степени k — 1 и hi — отличное от других собственное зна- значение, то для малых h ||||0 ">]^2'"> E3) а (и, — и), и{ — и*) < с'А2<*-т>я}"". E4) Если %i — кратное собственное значение, то можно выбрать ор- тонормальные собственные функции U) так, чтобы эти оценки

272 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ также были справедливы. Оценки E3) и E4) неулучшаемы и согласуются с частным случаем — оценкой B7) для линейных элементов. Доказательство. Неравенство E3) по существу совпа- совпадает с доказанным неравенством E2). Осталось лишь показать, .что множитель р близок к 1. Применим неравенство треуголь- треугольника: II«, I - II «I - К Но < IК 1!о < II «I I + II«, - К I Если вспомнить, что и1 и и1} — единичные векторы, и выбрать их знаки так, чтобы Р ^ 0, то последнее неравенство в выпи- выписанной цепочке равносильно^ — 1 |^||ы/ — Рм?||0- Поэтому I ui ~ м? Но ^ II и1 ~ Рм? Но + II (Р ~~ ^ м? |о ^ ^ II и1 ~ Рм? Но" Правая часть оценивается по E2), и неравенство E3) доказано: с = 2С". Ошибка в энергии E4) немедленно следует из леммы 6.3. (Это рассуждение проще всех известных нам рассуждений, связанных с собственными функциями.) Случай кратного собственного значения Ki = h+i = ... =^г+л труднее, но различия несущественны. Как и в D9), здесь также найдется постоянная р, отделяющая эти собственные значения от аппроксимаций Xf других собственных значений. Постоянная Р становится матрицей порядка R-\- 1, Длинная выкладка E0) теперь проделывается со всеми членами с номерами / = /, ..., / + R в левой части, а не правой, и это дает Обращая матрицу р, видим, что новые собственные функции Ui+r (линейные комбинации прежних) можно выбрать так, что Так как известно, что uf+r ортонормальны, то без ущерба для оценки можно, считать Ui+r также ортонормальными. Эта теорема и ее доказательство (с заменой лишь повсюду скалярного произведения (и, v) на b(u,v)) применяются и к обобщенной задаче на собственные значения Lu = %Bu.

6.4. ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ 273 6.4. ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ Принцип Рэлея — Ритца привел к матричной задаче на соб- собственные значения KQ = XMQ, которую и надо теперь решить. Однако эта задача не тривиальна, и она почти не рассматри- рассматривается в обычных учебниках по линейной алгебре. Эффективный алгоритм ее решения должен учитывать симметричность и поло- положительную определенность матриц К и М, а также их разре- разреженность. Последнее свойство, например, потерялось бы, если бы мы разложили М в произведение LLT (исключение Холес- ского) и вычисляли собственные значения матрицы L~lK{L~l)T с помощью обычного алгоритма. (Мы выбрали бы (^-алгоритм, начинающийся с преобразования исходной, матрицы в треуголь- треугольную, а не более старый метод Якоби.) Эта потеря разреженности не будет слишком серьезной в небольших задач, которые можно решать при наличии лишь оперативной памяти ЭВМ, но для больших систем этот подход не эффективен. Мы предлагаем отыскивать собственные значения (точнее, не- несколько первых собственных значений, поскольку было бы бес- бесполезно вычислять собственные значения высоких порядков, не имеющие физического смысла) непосредственно из уравнения KQ = KMQ. Мы отказываемся от приближенного расчета мат- матрицы М, поскольку диагональная матрица М ненамного лучше ленточной. Есть также метод экономизации, уменьшающий порядок си- системы за счет того, что в вычислениях участвует лишь неболь- небольшое число ведущих переменных. Априори предполагается зави- зависимость других подчиненных переменных, тем самым эти степени свободы исключаются [7]. Фрид описал эту идею так: поместим точечную нагрузку в узел Zj и обозначим через CDj решение ста- стационарной задачи, построенное по методу конечных элементов; тогда эти функции Ф^ образуют базис (не локальный в отличие от базиса, образованного исходными функциями ф^) для про- пространства пробных функций в экономизированной задаче. Мож- Можно ожидать, что эти функции достаточно хорошо представляют низкочастотные колебания, именно их и надо вычислять. Тем не менее у нас создается впечатление, что, по мере того как будут разрабатываться эффективные алгоритмы для исходной задачи, эта экономизация будет становиться менее необходимой и менее популярной. Авторитетная библиография по алгоритмам решения задач на собственные значения в период до 1970 г. содержится в [21]. Прежде чем описать новый метод, мы хотим рассмотреть очень - широко используемый метод из этого класса — метод обратной итерации, или обратной степени. В своей простейшей форме для задачи на собственные значения вида Ах =. %х обратная итера-

274 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ ция заключается в решении линейной системы на каждом шаге: Ауп+1 = хп. Тогда приближением к % будет %п+\ = l/||«/n+itl, а новым приближением к х— нормализованный вектор xn+i = = An+i#n+r- Они были бы точными, если бы хп был собственным вектором. Если представить себе, что начальный вектор х$ раз- разлагается по истинным собственным векторам Vj, т. е. х0 = Ъср$, то в результате п обратных итераций каждая компонента уве- увеличится в (Xj)~n раз; вектор хп пропорционален I,Cj(Xj)~nVj. Если Ai значительно меньше других собственных значений, то первая компонента станет преобладающей и хп будет прибли- приближать единичный собственный вектор V\. Сходимость подобна схо- сходимости геометрической прогрессии со знаменателем fa/fa, ошиб- ошибка хп — х имеет порядок (fa/fa)n. Очевидно, что метод эффектив- эффективнее, когда это отношение мало. Один способ уменьшить это отношение состоит в том, чтобы сдвинуть начало координат, заменяя А на п-м шаге матрицей А — %п1. Это сдвигает все собственные значения матрицы А на одну и ту же величину %п. Если Я„ близко к истинному собствен- собственному значению fa так что разность % — Хп мала, то соответствую- соответствующая компонента вектора уп+\ увеличивается на большой мно- множитель (% — %п)~1- Этот процесс легко численно реализуем, даже хотя матрица А — Xnf почти вырождена. На самом деле полезно иметь несколько лучшее приближение к собственному значению, чем %п = l/||t/nll. Например, отношение Рэлея Хп = (Ауп, Уп)/{уп,Уп) гораздо точнее. График этого отношения в окре- окрестности точного собственного значения (где расположена ста- стационарная точка) очень плоский, и алгоритм с этими улучшен- улучшенными сдвигами обладает кубической сходимостью: An+i — А~ ~ (fai.— ^K- С другой стороны, сдвиг А -+А — %п1 означает, что на каждой итерации надо снова выполнять исключение Гаусса: треугольные матрицы, на которые разлагается А, нельзя хранить и использовать в последующих итерациях, как это происходит в случае простой итерации Ayn+i = х„. В обобщенной задаче на собственные значения проще всего было бы на каждом этапе решать задачу Куп+\ = Мхп, а затем, нормализуя уп+1, получать xn+i- Однако при этом матрица К~1М не будет симметричной. Поэтому если представить К в виде разложения Холесского В-Вт, то можно использовать в итерационном процессе симметричную матрицу В~1М(ВТ)-1. Но тогда в процесс вовлекаются неразреженные матрицы, кото- которых мы хотели избежать, однако очевидно, что здесь итерация не начинается с их перемножения. Вместо этого для определения приближения ып+1 решаются уравнения BTvn+\ = и, Bwn+i = =з Mvn+i и затем нормализуется вектор wn+i. Сходимость нор- нормировочных множителей к fa и векторов vn (а не ип\) к соб- собственному вектору Х\ снова зависит от отношения Ai/Аг.

6.4. ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ 276 Очень полезный вариант обратной итерации — блочно-степен- блочно-степенной метод, предложенный Бауэром и улучшенный Рутисхаузе- ром, Петерсом и Уилкинсоном'). Его идея — одновременно ис- искать несколько собственных значений, рассматривая в итера- итерациях / приближенных собственных векторов. (Очевидно, что они должны спариваться по мере продолжения процесса, иначе по- получатся / различных приближений к одному и тому же основ- основному колебанию.) Скорость сходимости приближений к Я; равна Xi/fa+i, и можно без труда вычислять кратные собственные зна- значения. Блочная итерация для уравнения Ах = %х выполняется еле-' дующим образом. Пусть в качестве столбцов матрицы Ро раз- размера N X' взяты / начальных векторов, предполагаемых орто- нормальными. Первый шаг:.решаем / уравнений AZ\ = Ро. За- Затем, вместо нормализации отдельно каждого столбца из Z\, мы ортонормализуем все / столбцов. Для этого образуем матрицу ZT\ZX размера / X / и найдем ее собственные значения \ц2 (пер- (первые приближения к ЯГ2, .. •, ЯГ2) и соответствующие им соб- собственные векторы до,- Новое приближение Р\ есть произведение матрицы Z\ и матрицы W со столбцами omuii •••> ^гЩ- Так как РТ\Р\ — WTZ\Z\W = 1, то столбцы матрицы Р\ ортонормальны (это приближенные собственные векторы матрицы Л). На сле- следующем шаге решаем уравнения /4Z2 = Р\ и т. д. . Описанный алгоритм воспроизводит точно собственные век- векторы v\, ..., Vi матрицы А. Точнее, пусть каждый столбец из Ро записан в виде линейной комбинации векторов v\, ..., vh т. е. P0=VQ, где Q — ортогональная матрица размера /X'. а V — матрица размера Ny^l, со столбцами v\, ..., vi. Отметим, что если Л — диагональная матрица с элементами %\, ..., Хи то VTV=I и ЛУ= VA. Таким образом, первый шаг блочно-степенного метода дает Zl = A~lP0 = A~1VQ=VA~lQ, и Z\ZX превращается в QTA~2Q. Так как матрица Q ортогональна, то собственные значения \ij2 матрицы ZT\Z\ равны элементам ЯГ2 диагональной матрицы Л~2. Другими словами, если Po = VQ, то в результате первого шага получим Pi = V и правильные собственные значения. Изменения в "алгоритме, вызванные решением задачи AQ = = KMQ вместо Ах = Кх, описываются в последнем абзаце этой главы. Блочно-степенной метод в том виде, как он сформули- сформулирован здесь, легко поддается программированию. Изложенные методы обратной степени очень просты и прак- практичны, особенно когда достаточна небольшая точность. Но су- ') В технической литературе он известен как итерация в подпростран- подпространстве.

276 6- ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ ществует также новый способ, основанный на более тонкой тео- теореме о матрицах; наиболее успешно он применяется в задачах на собственные значения с ленточными матрицами KQ = XMQ. Этот вариант предложен Петерсом и Уилкинеоном [Ш, П2]; он опирается на следующую красивую теорему из теории матриц: число собственных значений, меньших заданного Хо, можно оп- определить, подсчитывая количество отрицательных ведущих эле- элементов при применении исключения Гаусса к матрице К — ХоМ. Из этой теоремы вытекает алгоритм, использующий деление пополам. Допустим, что мы уже определили, что п0 собственных значений меньше заданного Хо- Тогда ведущие гауссовы эле- элементы для К— (Хо/2)М дают пх собственных значений, меньших Хо12; остальные п0 — п\ собственных значений должны лежать между Хо/2 и Хо- Повторное деление пополам будет с большой точностью выделять любое собственное значение, но процесс требует исключения Гаусса на каждом шаге и потому займет много машинного времени. Его надо ускорить; это можно сде- сделать, если использовать значения, ведущих элементов (или их произведение, т. е. определитель d(X) = det (К—ХМ)), а не только их знаки. Клаф, Бас и Парлетт предложили ускоренную итерацию метода секущих: Это вариант обычного метода Ньютона, в котором производная заменена разностным отношением; множитель 2 принят для ус- ускорения. Как только Xh станет близким к истинному значению X, вычислитель может прекратить дальнейшую матричную фак- факторизацию и вернуться к обычной обратной итерации. Мы можем подтвердить, что алгоритм Петерса — Уилкинсона очень успешно применялся в численных экспериментах, изложенных в гл. 8. Дадим теперь теоретическое обоснование этого алгоритма. Оно опирается на классическую теорему, известную как закон инерции Сильвестра: если две вещественные симметричные мат- матрицы А и D связаны конгруэнтным преобразованием А = BDBT, где В — любая невырожденная матрица, то у одной из них столько же отрицательных, положительных и нулевых собствен- собственных значений, сколько у другой. Доказательство особенно просто, когда матрица D невырож- деннй, т. е. не имеет нулевых собственных значений. Пусть Bq — семейство невырожденных матриц, содержащее все матрицы от единичной (при 9 = 0) до матрицы В (при 0=1). (Мы не мо- можем гарантировать, что конкретная матрица Bq = QB + A — 9)/ будет невырожденной, но подходящую матрицу Bq построить нетрудно.) Матрицы BqDBq всегда симметричны и невырож- денны. Поэтому их собственные значения Х(Ь) вещественны, по-

6.4. ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ 277 следовательно изменяются вместе с 9 и никогда не пересекают нуль. Следовательно, число собственных значений по каждую сторону от нуля остается одним и тем _же как при 8 = 1, так и при 8 = 0. Другими словами, А и D имеют одинаковое число как отрицательных, так и положительных собственных значений. Если матрица D окажется вырожденной, то наши рассуждения можно провести для матриц D ± е/, а затем устремить е-*-0. Применим этот закон инерции к исключению Гаусса. Если матрица А, как и в разд. 1.5, представлена в виде LDLT, где L — нижняя треугольная матрица с единицами на диагонали, a D — диагональная матрица из ведущих элементов, то знаки ведущих элементов определяют знаки собственных значений. (В случае когда две строки в процессе исключения меняются местами, что необходимо, если один из предыдущих ведущих элементов ока- оказался равным нулю, то для сохранения симметричности матрицы надо поменять местами два соответствующих столбца. Такая перестановка дЪух строк и двух столбцов есть конгруэнтное пре- преобразование, осуществляемое матрицей перестановки В. Поэтому в данном случае закон инерции все еще применим и после та- таких перестановок ведущие элементы исключения Гаусса, все еще правильно определяют знаки собственных значений.) Описанный закон можно применить также к обобщенной за- задаче на собственные значения KQ = XMQ. Положим А = К — — %оМ и подсчитаем число отрицательных ведущих элементов . в исключении Гаусса. Мы утверждаем, что оно равно числу % собственных значений данной задачи KQ = XMQ, меньших Ко- В самом деле, перепишем рассматриваемую задачу в виде М-'/'КМ-'Ь(M'kQ) = %(M'I:!Q), так что п0 — число собственных значений матрицы М-'^КМ-''*, меньших Ко- Оно равно числу от- отрицательных собственных значений матрицы М-'/'КМг'1'— %о1. Но по закону инерции (снова! берем эту последнюю матрицу в качестве D, а В = М''2) оно совпадает с числом отрицательных собственных значений матрицы А = К—%оМ. Поэтому п0 легко определяется из исключения Гаусса, примененного к А. Соб- Собственные векторы получаются в результате одного или в край- крайнем случае двух шагов обратной итерации с матрицей С = К — — Д-вычисл-Л! В работе [П2] приведены хорошие начальные при- приближения к собственному вектору. Эксперименты по сравнению алгоритмов для вычисления соб- собственных значений все время продолжаются. Клаф и Бас нашли, что способы вычисления определителя (один из вариантов — ме- метод Петерса — Уилкинсона) особенно эффективны, когда ширина ленты невелика: для каждого собственного значения надо про- проделать в среднем пять факторизации на треугольные матрицы, а стоимость каждой итерации пропорциональна квадрату ши- ширины ленты. Наибольший успех давал блочно-степенной метод.

278 6. ЗАДАЧИ НА СОБСТВЕННЫЕ ЗНАЧЕНИЯ Клаф и Бас представили алгоритм в следующей эквивалентной форме. Исходя из матрицы Хп-и состоящей из / ортонормаль- ных столбцов, в качестве которых взяты приближения к соб- собственным векторам, решаем уравнение KYn ='MXn-i- Затем ре- решаем /-мерную задачу на собственные значения (YlKYn)Q = v(YTnMYn)Q. E5) Приближенными собственными значениями будут vw а новая матрица Хп, состоящая из приближенных собственных векторов, равна произведению матрицы Yn на квадратную матрицу по- порядка /, образованную из собственных векторов Q задачи E5). Бас и Парлетт детально изучили две вычислительные задачи: решение небольшой задачи E5), для которой они используют исключение типа Якоби, как только матрицы становятся почти диагональными, и выбор начальной матрицы Хо- При выборе / допускается компромисс — при больших / требуется мало ите- итераций, но каждая из них довольно дорога. При вычислении пер- первых р собственных значений они брали / = min Bp, p + 8) и об- обнаружили, что восемь итераций дают отличные результаты. Этот способ эффективен даже для задач, слишком больших, чтобы работать только с оперативной памятью ЭВМ, и его можно с успехом применять к задачам на собственные значения, воз- возникающим в методе конечных элементов.

ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ 7.1. МЕТОД ГАЛЁРКИНА-КРАНКА-НИКОЛСОНА ДЛЯ УРАВНЕНИЯ ТЕПЛОПРОВОДНОСТИ До сих пор мы обсуждали только стационарные задачи — за- задачи для эллиптических уравнений и на собственные значения. Метод Галёркина достаточно гибок, чтобы применить его и к задаче с начальными условиями; в этой главе мы рассмотрим для нее приближения по методу конечных элементов. Для об- общего вида областей и для задач, сравнительно медленно разви- развивающихся (малые числа Рейнольдса в случае течения жидко- жидкости), конечные элементы все еще обладают важными преиму- преимуществами перед конечными разностями. Для задач о распро- распространении волн с большими скоростями мы укажем некоторые их недостатки. Хорошо известна основная теорема для конечных разностей: формально согласованный метод сходится тогда и только тогда, когда он устойчив. Это утверждение дословно применимо и к приближениям по Галёркину. В самом деле, единственное от- отличие состоит в том, что для конечных элементов зачастую легче проверить устойчивость и согласованность, чем для конечных разностей. Мы покажем далее, как метод Галёркина модели- моделирует устойчивость дифференциального уравнения, а сейчас по- повторим то, что скрыто за предположением согласованности: ме- метод Галёркина согласован, если подпространства Sh плотны в пространстве допустимых функций. Это означает, что каждую допустимую функцию v можно сколь угодно хорошо приблизить пробными функциями vh при h -> 0. Теоремы аппроксимации гл. 3 устанавливают как раз это свойство; они дают даже сте- степень аппроксимации, переходящую в степень согласованности, или порядок точности, уравнений Галёркина. Эти идеи можно проиллюстрировать на уравнении теплопро- теплопроводности 17-¦§ = /(*,'), 0<*<я, *>0. A) Это параболическое дифференциальное уравнение описывает процесс передачи тепла в стержне; u = u(x,t)—температура в точке х в момент времени t > 0; f(x, i)—член источника тепла. Как и в предыдущих наших примерах, мы налагаем крае-

280 7. ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ вое условие4-Дирихле в точке х — 0 и естественное краевое ус- условие при х = я: «@,0= fj (я, 0 = 0. B) Физически первое условие означает, что температура левого конца стержня поддерживается равной 0. С другой стороны, ус- условие Неймана означает, что правый конец стержня изолиро- изолирован: нет градиента температуры через точку х — я. Чтобы за- закончить постановку задачи, выбираем начальную температуру: u(x,O) = tio(x), 0<*<я. C) Эта классическая формулировка задачи о передаче тепла чре- чревата трудностями. Например, условия B) и C) противоречивы, если Но Ф 0 при х = 0 или дио/дх Ф 0 при х = я. Кроме того, / может быть точечным источником, сосредоточенным в некото- некоторой точке Хо, и тогда уравнение A) в этой точке не выполняется. Во всех этих случаях лежащая в основе физическая задача все еще имеет смысл и состоит в нахождении распределения темпе- температуры, соответствующего начальной температуре и0 и источнику тепла /. Поэтому, как и в стационарном случае, мы ищем вто- вторую, интегральную формулировку задачи. Так как дцесь не работает естественный принцип минимума энергии (уравнение не самосопряженное), мы возвращаемся к задаче в слабой форме: при каждом t > 0 t-uxx-l)vdx^0. D) Для стационарного случая при щ = 0 и f = f(x) эта формули- формулировка совпадает с прежней формулировкой Галёркина. Чтобы достичь большей симметрии между пробной функцией и функцией и(х, t), проинтегрируем — uxxv по частям. Слагаемое uxv, возникающее при интегрировании, естественным образом обращается в нуль при х = я, и мы снова приходим к главному условию [email protected]) = О, т. е. к пространству Же'. л \ (utv + uxvx — fv) dx = 0 для всех v e ЖЕ- E) о Это равенство служит отправным пунктом для получения аппроксимаций по методу конечных элементов. Если задано N- мерное подпространство SH в Же, то принцип Галёркина со- состоит в следующем: найти функцию uh(x,t), принадлежащую

7.1. МЕТОД ГАЛЁРКИНА — КРАНКА - НИКОЛСОНА 281 при каждом t > 0 подпространству Sh и удовлетворяющую при всех vh e Sh уравнению я jj {u)vh + uhxvhx — fvh) dx = 0. F) о Отметим, что временная переменная непрерывна: формулировка Галёркина (или, точнее, Фаэдо—Галёркина) подразумевает дискретизацию по пространственным переменным и приводит к системе обыкновенных дифференциальных уравнений от вре- временной переменной. Эти уравнения и подлежат численному ре- решению. Чтобы записать полученную задачу в операторной фор- форме, выберем в пространстве пробных функций Sh базис фь ..., <р# и разложим неизвестное решение по базисным функциям: 2 Оптимальные весовые коэффициенты Q3 определяются согласно принципу Галёркина F): для k = l, ..., N Так как каждую функцию vh можно разложить по базисным функциям фй, то принцип Галёркина достаточно применить только.к базисным функциям. В результате получается система N обыкновенных дифференциальных уравнений с N неизвест- неизвестными Qi(t), ..., Qjv(O; краевые условия уже включены в эти уравнения. Начальное условие и = и0 все же надо учесть, и для этого есть несколько возможностей. С математической точки зрения естественным выбором аппроксимации начального усло- условия и\ будет наилучшее приближение к щ по методу наимень- наименьших квадратов: н^ принадлежит Sh и удовлетворяет уравнению (и$, ай) = (ы0, aft) для всех vh, т. е. ife=l, ..., N. На практике это означает, что надо вычислять интегралы в пра- правой части и обращать матрицу массы в левой части. Поэтому часто будет эффективнее взять в качестве начального условия интерполянт функции н0, т. е. положить hJ = (ho);. При этом по- порядок точности не изменится. Запишем теперь уравнения Галёркина G) в векторном обо- обозначении при Q = (Qi, ..., Qjv). Замечательно то, что эти урав-

282 7. ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ нения содержат в точности те же матрицы и вектор нагрузки, что и в стационарной задаче; коэффициент при Q' — это мат- матрица массы- М, а коэффициент при Q — матрица жесткости К: MQ' + KQ = F{t). (8) Компоненты правой части равны Fk =° \ f (х, t)($k{x)dx. Если бы краевые условия были неоднородными (зависящими от времени или нет), их влияние также было бы заключено в F. Естественно спросить: почему конечные элементы не исполь- используются также и по временной переменной? Конечно, можно было бы попытаться применить их, но это не даст особого успеха. С математической точки зрения вполне разумно изучить дискре- дискретизацию в два этапа: сначала исследовать ошибку метода ко- конечных элементов и(х, t) —uh(x, t], а затем ошибку в uh, возни- возникающую при решении обыкновенных дифференциальных урав- уравнений. По временной переменной геометрия области не вызы- вызывает трудностей, которые надо было бы преодолевать с помощью метода конечных элементов, и на самом деле непосредственное применение принципа Галёркина может связать все временные слои и уничтожить главное свойство распространения вперед по. времени. Мы не видим причин отказываться от этой дополни- дополнительной гибкости конечных разностей. Сначала стоит упомянуть метод наложения колебаний — кон- конкурента общепринятого метода конечных разностей. Его идея проста и заключается в разложении начального значения и0 и функции источника f по естественным гармоникам задачи — собственным функциям uht из гл. 6. Вся вычислительная работа сводится к задаче на собственные значения. Вперед по времени передаются только более низкие собственные значения; Никкелл предполагает, что, если функция f не очень насыщена высокими гармониками, хороших результатов можно достичь с менее чем 30 гармониками из 1000. . Общепринятая разностная схема по времени, связывающая все колебания, должна бороться с чрезмерной жесткостью урав- уравнения (8); число обусловленности матрицы М~ХК легко может превысить 1000, так "что колебания затухают с совершенно раз- разными скоростями. Если At выбрать надлежащим образом, то схема «правила трапеций» (Кранк — Николсон, Наймарк р) бу- будет автоматически отфильтровывать бесполезные высокие гар- гармоники. Конечно, эти схемы неявны, но таково же и дифферен- дифференциальное уравнение Галёркина: матрицу М в (8) нельзя обра- обратить, не разрушив ее ленточной структуры. (Приближенный рас- расчет матрицы М обсуждается в конце главы.) В одном отношении неявность уравнения не такое уж серьезное препятствие при рассмотрении параболических уравнений (например, уравнения

7.1. МЕТОД ГАЛЁРКИНА - КРАНКА - НИКОЛСОНА 283 теплопроводности), поскольку требования устойчивости для яв- явных разностных схем в любом случае суровы: временной шаг должен быть ограничен сверху At ^ Ch2, иначе в разностном уравнении будут неустойчивости экспоненциального характера. Напротив, неявная схема может быть абсолютно устойчивой; величина At ограничена лишь требованиями к точности, а не устойчивостью. Это различие между неявными и явными схе- схемами естественно для уравнения теплопроводности, где скорость распространения бесконечна: как бы ни был мал временной шаг,' температура Qn+1 в любой точке х0 зависит от температуры Qn во всех точках среды. Эта зависимость отражается в том, что матрица М~1 в уравнении Галёркина не разрежена, и в явном разностном уравнении для устойчивости требуется, чтобы Д* ~ hz. Исследуем схему Кранка — Николсона, записанную симмет- симметричным образом относительно (п + 7г)Д^ и потому имеющую по времени второй порядок точности: ' Q"+1 - Q" . „ Qn+i + Q" ._ Г+1 + Г m 1 М ' А 2 2 ' ^У' Приближение Qn+l определяется из соотношения (9), если пе- переписать его в виде При практическом вычислении можно матрицу в левой части представить, применив исключение Гаусса, в виде произведения LLT, где L — нижняя треугольная матрица Холесского, а затем вычислять Qn+1 на каждом шаге с помощью двух подстановок: Если коэффициенты в задаче зависят от времени (или нелиней- нелинейные), то в строгой теории Галёркина матрицы М и К. должны пересчитываться на каждом шаге. Весьма вероятно, что для по- получения матрицы жесткости, приближенно правильной, без пе- пересчитывания каждого интеграла, обязательно найдется возму- возмущенный вариационный принцип, приводящий к некоторому гиб- гибридному методу конечных элементов и конечных разностей. В больших задачах точный процесс отыскания Qn+1 может ока- оказаться слишком дорогим; итерационный подход к построению приближения для Qn+1 (возможно, исходящий из Qn как из на- начального приближения) может быть более эффективным. Дуг- Дуглас и Дюпон [Д8, Д11] предложили для нелинейных задач не- несколько итерационных способов, позволяющих решать на каж-. дом временном шаге большую нелинейную систему. Их анализ

284 7. ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ полностью оправдывает эти модификации чистого метода Галёр- кина. В двух других разделах данной гл.авы проверяются устойчи- устойчивости и ожидаемые скорости сходимости для параболических и гиперболических уравнений. В последнем разделе- при рассмо- рассмотрении простого уравнения щ = их появляются, наконец, неожи- неожиданности. 7.2. УСТОЙЧИВОСТЬ И СХОДИМОСТЬ ДЛЯ ПАРАБОЛИЧЕСКИХ ЗАДАЧ Здесь возможны два подхода к исследованию. Один — более явный и понятный; другой — более общий. В первом подходе каждую собственную функцию исследуют во времени во всех трех уравнениях — в дифференциальном урав'нении в частных произ- производных для и, обыкновенном дифференциальном для Ф и ко- конечно-разностном для Qh. Если коэффициенты и краевые усло- условия в уравнениях не зависят от времени (стационарный случай), то этот простой подход крайне успешен, а с учетом точных гра- границ ошибок в собственных функциях, выведенных в предыдущей главе, рассуждения становятся совершенно элементарными-1). В нестационарном случае исследование техничерки сложнее, но параболические уравнения так сильно диссипативны, что можно полностью объяснить эффекты временной зависимости (и даже нелинейности). Во втором подходе, основанном на энергетиче- энергетических неравенствах для каждого момента времени, это объясне- объяснение становится сравнительно простым. Рассмотрим параболическое уравнение щ + Lu = f, где L — некоторый эллиптический оператор, изученный в предыдущих главах. Он имеет порядок 2т (наиболее распространен случай m = 1), его коэффициенты могут зависеть от х. Предположим сначала, что f = 0 и начальная функция и0 разлагается в ряд по ортонормальным собственным функциям: "о = ? С1и1 М' С1==\ио М "/ М dx- 1 Каждая собственная функция затухает во времени с присущей ей скоростью, и решение меняется по закону u{t,x) = Y,c,e-%itut{x). A0) Для (>0 это решение принадлежит допустимому пространству Ж\. Даже если начальная функция ы0 разрывна, легко заметить, .что с течением времени функция и становится все более глад- 4) Этот подход применим также к анализу наложения колебаний.

7.2. УСТОЙЧИВОСТЬ И СХОДИМОСТЬ 286 кой; производные в любой положительный момент времени удов- удовлетворяют соотношению Экспоненциальные множители делают эту сумму конечной (то же справедливо и для пространственных производных). Эти нор- нормы с ростом t монотонно уменьшаются, в частности Ес/У^/Ч^-'Ес/2, или цИ(оио<в-л«'||ио||о. (и) Основная частота Xi > О дает скорость убывания решения. Уравнение Галёркина MQ' -f- KQ = 0 на самом деле несколь- несколько более устойчиво, чем уравнение, которое оно приближает. Предположим, что начальный вектор Qo разлагается по дискрет- дискретным собственным функциям Qj матрицы М~ХК, или, что эквива- эквивалентно, начальная функция uj — по приближенным собственным функциям иЧ: N N Q0 = ZdlQ/ или < = ?</,«*. Тогда решением в более поздний момент t будет Q @ = Z d,Qi ехр (- tft) или uh (х, 0 = Е **/"/ W ехр (- tft). Поэтому скорость убывания равна Я?, что несколько больше, чем %\: \\ ^ (х, t) j|0 < | и» ||0 ехр (-1*?) < |«»||Q ехр (- Я/). Наконец,, схема Кранка — Николсона также устойчива — без ог- ограничений на величину At. Разностный оператор на каждом шаге имеет те же собственные векторы, что и матрица М~1К, так как он задается равенством М + КМ ^д+1 М-КМ „п 2 У — 2 Ч ' ИЛИ Решением после п шагов будет Qn = 2] d; (м^)" Q/; где коэффи- коэффициент усиления \)Jf равен

286 7. ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ Так как каждое число А^ неотрицательно, то I \j!j | < 1, и потому схема Кранка — Николсона автоматически устойчива. Затухание основной собственной функции и\ регулируется ее коэффициен- коэффициентом усиления jj,f, сравнимым с истинным коэффициентом усиле- усиления ехр(—А? А/) уравнения Галёркина на каждом временном шаге: Так как ц* меньше, то эта компонента решения убывает в ко- конечно-разностном уравнении несколько быстрее. Различие между цЬ и ехр(— X*- А^)имеет порядок А<3, отражающий точность вто- второго порядка схемы Кранка — Николсона. В конечно-разностном случае высокочастотные компоненты не затухают со все более высокими скоростями. При Я*—>оо ко- коэффициент усиления \Л сходится к —I, и веса при высоких час- частотах изменяют знак на каждом временном шаге. Этого нет в уравнении Галёркина или в полностью неявной разностной схеме. В последней ц^ = A + Ц АА~' и очевидно, что \А—>0 при Xh,—>-оо. Для схемы Кранка — Николсона, однако, коэффи- коэффициент \Л станет отрицательным и начнет расти по абсолютной величине приЯ/^2/А<. Наивысшая частота, которую сетка мо- может «удержать», равна XhN~ch~2m; она обычно превышает 2/Д?. Поэтому очень высокие частоты (возможно, присутствующие лишь в малом количестве) действительно ослабляются менее сильно, чем умеренные. Если бы это представило какую-нибудь трудность, то, как и в гиперболических задачах, можно было бы добавить простой диссипативный член. Скорость сходимости легко определить из разложения по соб- собственным функциям: оо N h ¦ 1 1 Здесь два источника ошибки: начальная ошибка и развиваю- развивающаяся ошибка. Независимо от того, выбирается" ли «J как наи- наилучшее приближение к истинной функции и0 или просто как ее интерполянт, начальная ошибка и0 — и§ будет порядка hh и, подобно любому другому начальному условию, будет умень- уменьшаться со временем, как е~х'1. Кроме того, появляется ошибка, когда и? берется в качестве начального усло'вия в обоих уравне-

7.2. УСТОЙЧИВОСТЬ И СХОДИМОСТЬ 287 ниях. В точном уравнении она разлагается по собственным функ- функциям uh а в уравнении Галёркина — по uhs и по-разному разви- развивается во времени. Из предыдущей главы мы знаем, что »ft * ,2(fe-m), klm II ft || .fe«ft/2m Л/ — Л/ — fl Л/ , || Ы/ — W/ ||о '— Л Л/ • (В случае k < 2m, не обычном в практике, hh следует заменить на h2(h~mi.) Эти оценки показывают, что разность в весах равна лишь с, — dj = \ и*(ы, — ufydx~hk. Поэтому, сравнивая функ- функции и и uh, представленные в виде A3), видим, что развиваю- развивающаяся ошибка имеет порядок hh. Ошибка в производных, зату- затухающая опять со скоростью e~Xif, будет обычного порядка hh~s. Подчеркнем, что этот способ отыскания границ ошибок очень прост. С такой же легкостью он приводит к ошибкам порядка О (At2) в схеме Кранка — Николсона. Может показаться, что его простота требует, чтобы для возможности применения оценок ошибок в собственных значениях и собственных функциях из предыдущей главы пространственная часть задачи была само- самосопряженной, но на самом деле это предположение несущест- несущественно. Действительно, существует простая- формула, полностью обходящйя теорию собственных значений, — она относит разви- развивающуюся ошибку к основным оценкам стационарных задач. При одной и той же начальной функции ы* в обоих уравнениях различие в их решениях в момент t описывается формулой Здесь z — комплексное число, их — решение стационарной (неса- (несамосопряженной) задачи (L -\-z)uz = u^ и и\ — его аппроксима- аппроксимация по Галёркину. (Действительно, uz и и\ — преобразования Лапласа функций u(t) и uh(t) соответственно, а интеграл A4) обращает преобразование Лапласа; контур интегрирования С проходит вдоль двух лучей z = ± (я/2 + е) в левой полуплоско- полуплоскости, так что экспонента ezt дает сходящийся интеграл.) Из этой формулы, приводящей к разложениям по собственным функциям в самосопряженном случае с дискретным спектром, и из стацио- стационарных ошибок, установленных в теореме 2.1, непосредственно получаем выражение для развивающейся ошибки в момент вре- времени t, она имеет ожидаемый порядок h4 даже для несам.осо- пряженных уравнений. Чтобы закончить обсуждение этого первого подхода, заметим, что с помощью принципа Дюамеля можно" исследовать и неод- неоднородный случай f ф 0. Согласно этому принципу, функция ис- ¦ точника f в момент т действует подобно начальному условию в момент t — т. Если сначала решение и связано с д0 по неко-

288 ?¦ ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ торому закону u(t) =E(t)u0, то в неоднородном случае эта за- зависимость от исходных данных определяется формулой t u(t) = E(t)Uo+\E(t-%)f\x)d%. о Если воспользоваться разложениями по собственным функциям, то эта формула принимает вид и @ = ? и, (х) [С/в-V + \ f, (т) е~х1 ('-т) Ошибка и — uh будет все еще порядка hh, однако если источник f действует в течение всего времени, то коэффициент затухания е~и будет сказываться уже не очень сильно; будут еще ошибки, совершенные в моменты т, настолько близкие к t, что их затуха- затухание и не начиналось. Испробуем теперь другую идею — второй подход к парабо- параболическим задачам, упомянутый в начале раздела: оценим в каж- каждый момент времени t скорость изменения ошибки и — uh. Вме- Вместо того чтобы исследовать разложения и и uh по собственным функциям при t ~^z О, ошибку в момент t + dt (или, для случая разностного уравнения, в момент t-\-At) определяем из ошибки в момент t. Этот метод впервые' предложили Дуглас и Дюпон [Д8, Д11]. Они опирались на ранние работы Шварца и Венд- роффа [Ш1] и Прайса и Варги [П10]; Вилер, Денди и др. совсем недавно провели дополнительные исследования. Предположим, что в каждый момент времени t дифферен- дифференциальное уравнение и его аппроксимация по Галёркину записаны в вариационной форме: (ut, v) + а (и, v) = (f, v) для всех v s Ж1Е, A5) (и?, vh) + a(uh, vh) = (f, vh) для всех o'sS». A6) В стационарном случае энергетическое скалярное произведение a (v, до) не зависит от времени; оно возникает из (Lv, w). Будем по-прежнему обозначать через Р проектор Ритца, отображающий пространство допустимых функций Ж\ на его подпространство Sh и определяемый, как и в F.38),. соотношением а (и — Ри, vh) = 0 для всех vh. Представим ошибку по методу Галёркина в виде и — uh = = (и — Ри)-\-(Ри — uh). Величина и — Ри известна из теории

1.2. УСТОЙЧИВОСТЬ И СХОДИМОСТЬ 289 аппроксимации F.39), а энергетические неравенства, необходи- необходимые для оценки Ри — и\ вытекают из следующего тождества. Лемма 7.1. Если e(t) = Pu(t) —uh(t), то (et, е) + а (е, ё) = (Рщ - щ, ё). A7) Доказательство. Так как е принадлежит Sh, можно в A5) положить v = е, в A6) vh = е и затем вычесть из пер- первого уравнения второе: (ut — и\, е) + а (и — uh, ё) = 0. Применив тождество а(и — Ри,е)=0, видим, что второе сла- слагаемое равно а(е, е); после перегруппировки членов получаем {Put-uht, ё) + а(е, e) = (Put-uf, ё). Осталось отождествить первое слагаемое со скалярным произве- произведением (et,e), т. е. убедиться, что Рщ = (Pu)t (проектор Ритца Р коммутирует с оператором дифференцирования d/dt). Это справедливо только в стационарном случае. Если бы энергетиче- энергетическое скалярное произведение зависело от t, то член (Рщ—(Pu)t, e) также появился бы в тождестве и его надо было бы оценить. Если оператор L достаточно гладкий по временной переменной, то эта трудность чисто техническая (подробности мы опускаем). Очевидно, что в стационарном случае Р не зависит от времени: дифференцируя тождество (и — Pu,vh) = 0, имеем (щ — (Pu)t, vh) = 0 для всех vh, так что (Pu)t совпадает с Рщ. Лемма дока- доказана. Из этого тождества легко найти скорость изменения ошибки. Первое слагаемое в A7) можно переписать в виде Так как.Я: — минимум отношения Рэлея, то слагаемое а(е, е) не меньше, чем Хх \\e\fu. Наконец, правая часть тождества ограничена величиной \\ut — />«tllo*lie|[o. Сокращая на общий множитель ||е||о, получаем неравенство fr PMIo- A8) Умножим A8) на ех>т и проинтегрируем по т от 0 до t: \%с1х. A9) о 10 Зак. 287

290 7. ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ Независимо от того, выбирается uft как интерполянт функций и0 или как ее аппроксимация по методу наименьших квадратов, начальная ошибка е@) = Ри0 — м? имеет порядок C7ift||uoll&. Из неравенства A9) немедленно следует основная теорема, дающая правильный порядок сходимости, хотя формулируемые оценки не обязательно будут самыми точными. Теорема 7.1. Пусть Sh — пространство метода конечных эле- элементов степени k—1. Тогда ошибка аппроксимации по методу Галёркина удовлетворяет неравенствам II" (О - uh (t) ||0 < \\ и (t) - Ри (t) Но + || е @ Но < - < Си* || и @ \\k + е-^ || «о к + $ е*' (т~'> IIЩ (т) ||ft dx I. B0) Таким образом, ошибка имеет тот же порядок hh, что и в ста- стационарных задачах, и при отсутствии функции источников она убывает так же быстро, как и основное колебание. Оценка, которую дает эта теорема, совпадает с оценкой hh, установленной ранее с помощью разложений по собственным функциям. Усредненную оценку ошибки по энергии получаем, интегрируя непосредственно тождество A7): t t 2 J а (е (х), е (х)) dx < || е @) |g - \\е (t) |g + 2 $ | (Рщ - щ, е) |2 dx. о * о Согласно только что доказанной теореме, правая часть послед- последнего неравенства имеет порядок h2h. Это говорит о том, что е в энергетической норме пренебрежимо мала по сравнению с и — Ри и ошибка приближения по Галёркину и — uh = u~- <—Ри + е удовлетворяет соотношению а(и-и\ u — uh)~a{u — Pu, ы-Рм)<С2Л2(*-т'||"Н|. B1) На этом мы заканчиваем исследование ошибок для параболи- параболических уравнений; ничего неожиданного в результатах нет. У нас создалось впечатление, что, как и в стационарных задачах, ме- метод конечных элементов особенно эффективен при вычислениях на грубых сетках с большим шагом h. В этой ситуации физику процесса часто точнее отражает принцип Галёркина, на котором' основан метод конечных элементов, чем предположения о бли- близости разностных отношений к производным. Однако так как в методе конечных элементов приходится вычислять интегралы,

7.3. ГИПЕРБОЛИЧЕСКИЕ УРАВНЕНИЯ 291 то за это надо платить затратой времени. Возможно, в конце концов появится удовлетворительная комбинация конечных эле- элементов и конечных разностей. 7.3. ГИПЕРБОЛИЧЕСКИЕ УРАВНЕНИЯ Естественно попробовать применить метод конечных элемен- элементов также и к гиперболическим задачам. Действительно, форму- формулировку принципа Галёркина можно обобщить так (уравнение М(и) = 0 заменить из (M(uh), vh) = 0 для всех vh), чтобы ме- метод конечных элементов можно было проверить на большем ко- количестве примеров. Некоторые предварительные испытания уже ведутся, но выводов еще нет (и, может быть, никогда не будет, поскольку характер большинства численных экспериментов не- недостаточно ясен). По-видимому, можно ожидать лишь догово- договоренности по некоторым общим направлениям. Математически можно гарантировать1) одно свойство, за- заключающееся в том, что если энергия в точной задаче сохра- сохраняется, то она сохраняется и в методе Галёркина и, если в точ- точной задаче она со временем уменьшается, она уменьшается и в аппроксимации Галёркина. Это легко заметить для системы первого порядка щ + Lu = 0. Скорость изменения энергии (и, ы)= \ и2 dx можно вычислить, умножая уравнение на и и ин- интегрируя по пространственной переменной: (щ, и) + (Lu, ы) = -|- ^Л. + (Lu, и) = 0. Если (Lu, и) ?= 0, то рассматриваемое уравнение называется консервативным ((и, и) не изменяется со временем); если же (Lu, и) ^ 0 для всех возможных состояний и, то оно называется диссипативным (энергия (и, и) уменьшается). Параболические уравнения строго диссипативны, так как в этом случае (Lu,u) — положительно определенная форма от т-х производных от и. Гиперболические уравнения либо консервативны, либо в лучшем случае слегка диссипативны; энергия может «вытекать» наружу (но только очень медленно) на границах области. Поэтому исследование этих уравнений гораздо тоньше. Пусть в методе Галёркина Q означает проектор из [email protected]° на подпространство Sh, т. е. Qu — наилучшее приближение к и. в 'Sh по методу наимень> ших квадратов, в то время как ранее рассматриваемая проек- проекция Ри была наилучшим приближением по норме энергии де- деформации a (v, v). Тогда приближение по Галёркину uh опредэ- 4) При условии, что тестовое пространство Vh совпадает с пробным прсь странством Sh,

292 7- ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ ляется проекцией дифференциального уравнения на подпростран- подпространство Sh: Так как требуется, чтобы функция ин принадлежала Sh, то ав- автоматически uh 5= Quh, и уравнение Галёркина можно записать в более симметричном виде и) + QLQuh = О, и* <= Sft. Другими словами, точный порождающий оператор L заменяется на QLQ. Но тогда консервативное уравнение остается консерва- консервативным, (QLQu,u) = (LQu, Qu) = 0, а диссипативное — дисси- пативным: (QLQu, и) s= (LQu, Q«) ^ 0. Соответствующие нели- нелинейные операторы называются монотонными (разд. 2.4), и спра- справедлив тот же результат. Интересно, что свойство консервативности не всегда жела- желательно, в частности в нелинейных гиперболических уравнениях. Простейший пример — закон сохранения щ = (и2)х. В решениях этих задач могут быть самопроизвольные разрывы (скачки) и сохранение энергии теряется, даже хотя некоторые другие за- законы сохранения массы и момента выполняются. В уравнении Галёркина этих скачков, по-видимому, нет совсем и приближен- приближенное уравнение остается консервативным — отсюда следует, что сходимость к истинному решению невозможна. В методе конеч- конечных разностей обычный прием состоит в том, чтобы рассеять энергию с помощью искусственной вязкости; по-видимому, это будет необходимо и для конечных элементов. Гиперболические уравнения могут появляться в двух фор- формах— в виде системы первого порядка по времени, скажем wt + Lw = / с вектором неизвестных до, либо как уравнение вто- второго порядка utt + Lu = /. Начнем со второго случая, в котором L — эллиптический оператор; типичным примером служит вол- волновое уравнение ип — с2ихх = 0. Слабая форма этого уравнения такова: (utt, v) + а (и, v) = (/, v) для te*", t > 0. B2) В аппроксимации Галёркина и и v заменяются на uh и vh\ это означает, что ин = Л Q/ (t) q>/ (х) определяется из уравнения (Е 0?Ф/. Фа) + B Q/Ф/. Ф*) = (/, Ф*) Для А = 1 N,t>0. B3) Это снова обыкновенное дифференциальное уравнение от вре* менной переменной. Здесь участвуют те же матрицы массы и жесткости, но уравнение уже второго порядка: B4)

7.3. ГИПЕРБОЛИЧЕСКИЕ УРАВНЕНИЯ 293 Исходными значениями будут приближения (из Sh) к точному перемещению ио(х) и точной начальной скорости и'0(х). Пове- Поведение решений в данном случае совершенно отличается от пове- поведения в параболическом случае, где вместо Q" стоит Q'. Там (при F s= 0) решение очень быстро затухает; каждый собствен- собственный вектор входит в решение вместе с экспонентой e~V и раз- разрывы немедленно исчезают. В гиперболическом случае показа- показатель степени меняется на ±iXjtn Q скорее осциллирует, чем за- затухает. Решение не более гладко, чем начальные значения, и разрывы распространяются сколь угодно долго по времени. Для одномерного волнового уравнения и линейных элемен- элементов аппроксимация Галёркина имеет вид _, _ Отметим снова связанную форму этих уравнений, автоматически приводящую к неявному разностному уравнению. Из экспери- экспериментов Клафа и др. и теоретических рассмотрений Фуджи, доло- доложенных им на Втором японо-американском семинаре, можно сделать вывод, что если матрица М заменяется (в подходящем процессе ее приближенного расчета) диагональной, то потери в точности не будет. Но это верно не для всех степеней элемен- элементов: для членов, не продифференцированных по х, приближен- приближенный расчет неявно использует элементы низких степеней (боль- (большей частью кусочно постоянные), и это приводит к потере об- общей точности, когда другие члены в уравнении обрабатываются с высокой точностью. Фуджи дал также полезный анализ устойчивости разностных аппроксимаций (по временной переменной) уравнения B4) в методе конечных элементов. Предположим, например, что члены Q" заменяются центральными разностными отношениями вто- второго порядка (At)-2(Qn+l— 2Qn + Q™-'). Из теории конечных разностей хорошо известно, что величина At должна быть ог- ограничена, или же вычисляемые приближения Qn будут экспо- экспоненциально расти вместе с п. Для одномерного волнового урав- уравнения условия устойчивости процесса вычислений имеют вид сА^^/г/д/З для согласованной матрицы массы М и cAt^h— для диагональной матрицы, полученной при приближенном рас- расчете матрицы М. (Тонг [Т6] заметил в последнем случае допол- дополнительную устойчивость.) Фуджи исследовал и другие конечно- разностные схемы, а также гиперболические уравнения более об- общего вида для краевых задач с начальными условиями, в том числе и уравнения упругости. Аппроксимация по Галёркину обладает двумя важными свой- свойствами: сохранение энергии (если / = 0) и сходимость. Чтобы

294 7. ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ измерить энергию в гиперболической задаче второго порядка, сложим потенциальную и кинетическую энергии: а(и, и)]. Для волнового равнения эта энергия равна l/2 \ («?+ c2u2\dx. Величина E(t) не зависит от времени, так как при v = щ в B2) 4 щ) = 0. ' B5) Для волнового уравнения соотношение B5) принимает вид ¦—¦ Сохранение энергии в уравнении Галёркина можно проверить тем же способом: = ^ (щии + c2uxuxi) dx=\jui (uti — с2ихх) dx = 0. @ = \ [(«?,«?) + а (и\ и% К. О + а («»,«?) = 0. Таким образом, подобно точному уравнению, приближенное уравнение только нейтрально устойчиво. Дадим набросок доказательства сходимости, вытекающего из тождества, аналогичного доказанному в лемме 7.1: при е = Ри — uh (е«, е<) + а (е, et) = ([Pu — u]it, et). B6) Левая часть есть производная от энергии E(t,e) в е. Энергия ошибки не обладает свойством сохранения, но правая часть в B6) меньше, чем II (Ри - uh Ik II et Но < Chk л/Ё1Гё). Итак, Е' *^Chk л/Е. Интегрируя от 0 до t, получаем Начальная ошибка Ео будет порядка /i2<fe-'); и такой же будет энергия вы — Ри. Поэтому энергия ошибки Галёркина и — uh = = и — Ри-^-е имеет оптимальный порядок h4k~l). Это справед- справедливо даже при больших значениях t ~ l/h, если только началь- начальные данные гладкие. Рассмотрим теперь тривиальный, но интересный пример щ = их. Само уравнение не слишком увлекательно; оно описы- описывает распространение волны влево с единичной скоростью,

fr.3. ГИПЕРБОЛИЧЕСКИЕ УРАВНЕНИЯ U9t u\x,t) = Uo{x'-\-t). Искажения волны нет и очевидно, что энер- оо гия системы первого порядка \ u?dx сохраняется. Приближе- ^ — оо нием по Галёркину в каждый момент времени будет (и.%, vh\= = (uhx, vh\ оно также сохраняет энергию. При линейных элемен- элементах uh {t, х) = ^ U] (t) cpj (x), где ф; — функция-крышка в узле /ft, это приближение принимает вид «;+| + 4В;+ «,;_,- «/+,-а/_, 6 2А • W Очевидно, что уравнение B7) снова неявное — это серьезный не- недостаток для гиперболических задач. Ошибка аппроксимаций равна О (ft2), т. е. равна обычной скорости сходимости для линей- линейных элементов. Дюпон [Д12] вычислил соответствующую скорость сходимости для кубических пробных функций, и оказалось, что ожидаемая степень ft4 просто не появляется. Ошибка и — uh имеет порядок O(h3), т. е. на порядок больше наилучшего приближения к и с помощью кубических элементов. Расчеты Дюпона, встречен- встреченные с удивлением и, возможно, даже с некоторым недоверием, проводились для эрмитовых кубических элементов со значениями и и их в каждом узле в качестве неизвестных. Для кубических сплайнов его вычисления показали ошибку O(hA). Поэтому ско- скорость сходимости зависит не только от степени конечных элемен- элементов. Действительно, более широкое пространство эрмитовых ку- кубических элементов дало худшую аппроксимацию, чем его под- подпространство кубических сплайнов. Частично это объясняется так. Вычислим ошибку аппроксимации в общем случае, подстав- подставляя истинное решение уравнения ut + Lu = 0 в уравнение Га- лёркина и* + QLQuh = 0. В нашем случае L = —д/дх и Q — про- проектор на подпространство Sh. Ошибка аппроксимации равна Первое слагаемое в правой части представляет собой ошибку приближения функции Lu = —их по методу наименьших квад- квадратов. Если Sh имеет степень k— 1 и функция и гладкая, то эта ошибка обычного порядка hh. Но решающую роль играет второе слагаемое QL(I'— Q)u. Так как L(I—Q)u есть производная от ошибки приближения по методу наименьших квадратов, то это ошибка в норме пространства Ж{, и она не может быть лучше чем hh~l. Вопрос заключается в следующем: аннулируется ли L(I—Q)u при действии последнего проектора Q? Мы полагаем,- что это происходит в случае линейных элементов на равномер-

296 1- ЗАДАЧИ С НАЧАЛЬНЫМИ УСЛОВИЯМИ ной сетке, но не обычных кубическ