Методы обработки экспериментальных данных
1. Сглаживание табличных данных
Экспериментальные исследования, проводимые как в натуре, так и на моделях, должны быть предварительно тщательно продуманы не только в отношении порядка их проведения, но и в отношении выбора способов обработки результатов наблюдения.
Наблюдения обобщают не только по окончании опытов, но и в ходе проведения. Внимательный и добросовестный исследователь всегда стремится еще в процессе опытов установить необходимые закономерности, возможные отклонения и их причины, новые факторы, связи, взаимодействия. Для обобщения используют все материалы наблюдений: таблицы записей, осциллограммы, записи на магнитных носителях, фотоснимки и т.д. Не следует забывать и мелких заметок, так как иногда подмеченное во время опыта явление, кажущееся случайным, может объяснить причины и развитие явлений.
Сопоставляя все материалы исследователь ищет раскрытие связей взаимодействия, функциональных зависимостей факторов. Установив их, он выделяет главные связи, зависимости, взаимодействия и устанавливает общие закономерности явлений.
При обработке опытных данных надо стремиться как можно более разносторонне представить различные связи и отношения, сопоставить значения отклонений, скорости изменения величин и соответствующих ускорений, максимумов и минимумов, сравнивать различные величины, расположенные в порядке увеличения или уменьшения их значений и применять другие приемы.
Функциональные связи легче найти, если данные опытов представить таблицами или графиками.
В таблице вначале выделяют по физическому смыслу аргумент (независимую переменную), затем функцию (зависимую переменную).
Желательна следующая форма таблицы:
- номер и краткое, точное название;
— в первом столбце располагают значения аргумента, а в остальных — значения функций. Иногда целесообразно несколько столбцов объединять в один раздел с общей заголовочной частью и подзаголовками в каждом столбце.
2. Основные правила составления таблиц
1. Аргумент располагают строго логично основному, существенному признаку (например, по величине, в возрастающем или убывающем порядке).
2. Все столбцы должны иметь краткие, ясные заголовки с указанием размерности помещаемых величин.
3. При заполнении таблицы следует помнить, что если данных нет, надо ставить тире, а не ноль — это определенное значение аргумента или функции. Запятые, отделяющие целую часть от дробной, в каждой графе следует располагать одну под другой (в линию).
База данных компьютерного магазина
... в нашей работе такие типы связи нам не следует употреблять. Для базы данных компьютерного магазина инфологическая модель будет выглядеть так(Рис 1): Рис. 1. Инфологическая модель базы данных компьютерного магазина Структура и создание таблиц В таблицах данные распределяются по ...
4. Проще всего размещать в таблице результаты опытов с одной повторностью, так как при этом не требуется каких-либо вычислений.
Пусть, например, при измерениях частоты вращения коленчатого вала двигателя в лабораторный журнал записаны данные в следующем виде (табл. 1).
В таком виде данные опытов трудно считать и закономерности остаются неясными. Выделим аргумент по физическому смыслу. Понятно, что температура воды в радиаторе и масла в картере не могут быть аргументом.
Таблица 1 Данные опытов
Сопротивление трения, кг |
6,70 |
5,85 |
8,00 |
5,50 |
6,10 |
7,50 |
|
Температура воды в радиаторе, град |
77 |
78 |
72 |
80 |
78 |
74 |
|
Температура масла в картере, град |
82 |
82 |
81 |
82 |
82 |
82 |
|
Частота вращения вала, об/мин |
1000 |
600 |
1400 |
400 |
800 |
1200 |
|
Сопротивление трения в опытах не регулировали и интервалы по нему между данными различных опытов неравномерны. Из этих соображений считаем аргументом частоту вращения вала двигателя в минуту и располагаем аргумент в возрастающем порядке. За аргументом располагаем, как наиболее существенную функцию, данные о сопротивлении трения (табл. 2).
Таблица 2 Данные опытов
Частота вращения вала, об/мин |
Сопротивление трения, кг |
Температура воды в радиаторе, град |
Температура масла в картере, град |
|
400 |
5,50 |
80 |
82 |
|
600 |
5,85 |
78 |
82 |
|
800 |
6,10 |
78 |
82 |
|
1000 |
6,70 |
77 |
82 |
|
1200 |
7,50 |
74 |
82 |
|
1400 |
8,00 |
72 |
81 |
|
Как видно из таблицы функциональные связи стали яснее. Общей закономерностью является увеличение сопротивление трения и понижения температуры воды в радиаторе; температура же масла в функции частоты вращения вала падает медленно. Сложнее составить таблицу при большой повторности измерений.
3. Сглаживание табличных данных и графиков
Полученные в таблицах ряды цифр или кривые графиков вследствие различных причин могут изменяться не плавно. Например, кривые, проведенные по точкам опытов, будут ломаными. Прежде всего, следует установить, не являются ли скачки цифр и изломы линий следствием естественных закономерностей и, если потребуется, повторить все опыты, может быть, сузив их границы и приняв все меры к тому, чтобы исключить влияние ошибок наблюдения.
Затем надо решить, являются ли скачкообразные изменения необходимыми для объяснения явления. Например, при исследовании затрат энергии в трансмиссии в функции передаваемой мощности скачкообразные изменения не объясняют явления и зависят от случайных причин. В подобных случаях кривые должны протекать плавно, их надо сглаживать. Если же взять исследование вибрации деталей, то здесь предметом исследования являются сами скачкообразные изменения величины, связанные с сущностью явлений, и спрямлять, сглаживать их нельзя.
Основанием сглаживания кривых является плавность изменения функции при плавном изменении аргумента. Выровненные кривые должны наиболее близко отображать общую закономерность развития явления. Это означает, что они не обязательно должны быть средними и что усреднение — это лишь один из приемов сглаживания и выравнивания. Следует отметить, что после проведения выравнивания нельзя уничтожить первоначальные таблицы и графики, так как они являются документом необходимой ступени исследования. Если отдельные резкие отклонения находят объяснение в изменении условий измерений, их опускают, а вместо них при помощи интерполяции находят точки, близко расположенные к естественной плавной кривой. Если резкие отклонения не могут быть объяснены изменениями условий измерений, то опыт лучше повторить и даже группу опытов.
Далее надо выяснить, насколько разбросаны точки опытов в обе стороны от воображаемой плавной кривой, соединяющей их. Разброс опытных точек неизбежен и надо решить, необходимо ли сглаживать кривую. Дело в том, что сглаживание любым методом может в той или иной степени изменить параметры опытной кривой, смягчить, уменьшить ее перегибы, и поэтому если все опытные точки могут быть соединены плавной кривой (то есть иначе, если разброс точек лежит в пределах ошибки чертежа), то выравнивания не требуется. Если же разброс точек опытов таков, что соединить их плавной кривой невозможно, нужно сгладить ее, сохранив общий характер развития данной несглаженной функции. Есть два широко применяемых способа выравнивания таблиц с постоянным шагом: способ разностного сглаживания, способ наименьших квадратов.
4. Способ разностного сглаживания
По способу наименьших квадратов сглаженное значение неплавной функции будет равно:
(1)
где — сглаженное значение, которым его заменяют;
- два предшествующих значения функции относительно
- два последующих значения функции относительно .
Достоинство этого способа — его точность, особенно для параболической зависимости .
Недостаток — две первые и две последние точки не подлежат сглаживанию. Поэтому способ наименьших квадратов применим лишь при 8-9 и большем количестве опытных точек. Если необходимо, сглаживание повторяют.
Способ разностного сглаживания охватывает все ряды, но требует, чтобы разность в значениях функции между двумя последующими значениями не превышала 2-5% величины функции, поэтому его можно применить только к измерениям достаточно высокой степени точности и плавности.
Порядок разностного сглаживания заключается в следующем:
1. Из таблицы берут значение аргумента и функции . Значение аргумента записывают в первом столбце таблицы 3, а значение функции — в третьем столбце.
2. Вычисляют средние межклассовые значения аргумента и заносят их во второй столбец.
3. Определяют разности значений функций по третьему столбцу и заносят в четвертый столбец против средних межклассовых значений аргумента.
4. Наносят значения разностей на график в функции средних значений аргумента .
5. На графике на глаз проводят линию, среднюю по отношению к точкам разностей .
6. Берут по графику сглаженные разности , заносят их в пятый столбец против несглаженных разностей.
7. Находят сглаженные значения функций и записывают их в шестой столбец.
Если первичного сглаживания недостаточно, то проводят вторичное, так же, как первое.
Сглаживание графиков (проведения плавной кривой по опытным данным, имеющим разброс) также подчинено некоторым простым правилам. Чтобы провести плавную кривую, надо использовать остро отточенный твердый карандаш и прозрачные гибкие шаблоны (лекала, угольники, линейки).
Не обязательно, чтобы кривая проходила через опытные точки, но необходимо сохранить общий характер закономерности. Расположение кривой должно соответствовать физическому смыслу явления.
Основное правило графического сглаживания: плавная кривая должна быть возможно ближе ко всем опытным точкам. Отсюда вытекает требование того, чтобы сумма отрезков нормалей, опущенных из опытных точек на кривую, должна равняться нулю.
Вначале осторожно, без нажима проводят первую кривую. Если она не удовлетворяет проверочным требованиям, ее не стирают, а наносят вторую линию. Если понадобится, то вычерчивают третью линию, затем тонкой линией обводят лучший вариант, а остальные стирают.
При точном и полном выполнении проверочных требований графический способ сглаживания кривых является наиболее общим и универсальным.
После проведения сглаживания табличных данных (или графического) строят сглаженную кривую и по ее виду определяют вид эмпирической кривой.
5. Методы интерполяции и экстраполяции
Под интерполяцией подразумевается нахождение промежуточных значений функций (внутри опытного ряда).
Наиболее простым является метод линейной интерполяции. Когда функция на данном отрезке линейна или близка к линейной, то этот метод точен. Если не требуется высокая точность, то его можно применить и к нелинейным функциям. Этот метод заключается в следующем: имеем таблицу 3 с данными аргумента и функции.
Функций может быть несколько, то есть эту таблицу можно продлить. Например, мы хотим в таблице заменить значение у 3 , которое исключили при анализе статистических данных, новым, найденным линейной интерполяцией. Берем разность между соседними данными у2 и у4 , то есть
Таблица 3 Таблица данных аргумента (х) и функции (у)
Между значениями у 4 и у2 два промежутка. Предполагая пропорциональность , где — шаг аргумента, получаем:
Это значит, что аргумент х 3 соответствует поправке к функции .
Знак + выбирается в зависимости от возрастания или убывания функции. Если функция возрастает сверху вниз ставится знак плюс, если убывает сверху вниз — знак минус.
В сущности методы табличного и графического сглаживания методом наименьших квадратов (МНК и разностного сглаживания) экспериментальных данных можно отнести к методам первичной линейной интерполяции. Более точным оказывается применение интерполяционных формул Ньютона, Лагранжа, итерационно-интерполяционных способов (процесс Эйткена).
Необходимо обратить внимание на то, что понятия «интерполяция» и «аппроксимация» являются родственными. Но в контексте излагаемого можно понимать аппроксимацию несколько шире, чем интерполяцию, т.е. не только сглаживание результатов наблюдений, но и получение аппроксимационной эмпирической зависимости с учетом получения случайных результатов наблюдений ПФЭ. В то время, как интерполяция предусматривает только нахождение промежуточного значения функций, а в случае применения интерполяционных формул Ньютона и Лагранжа, так же получение интерполяционного полинома применяются для приближения вычислений значений функций. Это наиболее частый способ применения или для приближенного решения уравнений, содержащих нерешаемые аналитические функции (например, нелинейного уравнения, когда задана в точках в окрестности искомого корня).
Под экстраполяцией понимается нахождение по опытному ряду значений функций других ее значений. Экстраполяцию применяют тогда, когда пределы измерения факторов, полученные в опытах надо расширить, но пользоваться ею следует осторожно. Если закономерности изменения функции могут быть представлены рациональной формулой, то лучше всего для экстраполяции эти закономерности выразить математически. Когда имеется эмпирическая формула или график опытных закономерностей, интерполяция в большинстве случаев в пределах одного классового интервала (по аргументу) в каждую сторону (по формуле или продуманным продолжением плавной кривой) дает практически приемлемую точность, но более широкая экстраполяция будет ненадежной.
Рассмотрим интерполяционные формулы Ньютона и Лагранжа.
Смысл: представление функции на отрезке с помощью полинома.
(2)
Этот полином может применяться для получения сплайн-функций, т.е. кусочно аппроксимирующих. В самом деле, для получения полинома второй степени нам достаточно трех точек, третьей — четырех. Таким образом интерполяционная формула позволяет «сгладить» результаты внутри какого-то, как правило, короткого отрезка. Не следует путать интерполирование такого типа формулами с получением аппроксимирующего полинома (или получением линии регрессии).
Пример : экспериментально получено:
представить приближенную функцию в виде полинома 2-й степени
;
;
Формула Ньютона — так же интерполяционный многочлен (полином)
- шаг аргумента .
По существу многочлен Лангранжа и Ньютона тождественны. Во многих случаях интерполяционный многочлен Ньютона удобней, т.к. при переходе от многочлена R-й степени к R+1 — первые (R+1) членов не изменяются, а добавляется новый член поэтому удобнее программировать.
Необходимо отметить, что интерполяционные полиномы Лагранжа и Ньютона справедливы на интервалах , причем точно их графики проходят только через имеющиеся точки. Экстраполировать по этим многочленам не рекомендуется.
6. Установление параметров и видов законов распределения случайных величин
Подбор типа формулы — главное, что определяет результативность и точность формулы.
Нельзя указать общего метода для нахождения наилучшего типа эмпирической формулы, соответствующей экспериментальным данным.
Иногда тип формулы предопределяется соображениями физического характера. Предпочтение отдается наиболее простым формулам. Удачный подбор эмпирической формулы в значительной степени зависит от опыта и искусства исследователя.
В тех случаях, когда нет возможности руководствоваться теоретическими соображениями, поступают следующим образом.
1. Экспериментальные данные наносят на чертеж.
2. Полученные точки соединяют плавной кривой.
3. По виду плавной кривой и характерным точкам (Х = 0, У=0 и т.п.) подбирают тип зависимости.
4. Проверяют условия выбора исходя из требований точности.
Например: линейная функция выбирается при соблюдении условия линейности.
Если графическое представление экспериментальных данных далеко от линейного, то используют образцовые функции, вид которых имеется в любом справочнике (табл. 4).
Таблица 4 Основные типы эмпирических формул (с двумя параметрами)
Необходимые условия |
Вид эмпирической формулы |
Способ выравнивания (приведения к линейной зависимости) |
|
1. |
|||
2. |
|||
3. |
или , где |
||
4. |
|||
5. |
|||
6. |
|||
7. |
|||
Пояснения к таблице 4:
- если с требуемой точностью имеет место равенство (столбец 2 таблицы 9.5), то в качестве эмпирической формулы следует взять соответствующую из столбца 3;
- по способу выравнивания находим и в прямоугольной системе координат строим точки . Если в пределах допустимой точности они лежат на прямой, то выбранная эмпирическая зависимость принимается;
- если значения функции при значениях аргумента в 2-м столбце отсутствуют, то они находятся линейной интерполяцией.
Пример линейного выравнивания
Логарифмируя получаем:
Легко проверить, что необходимым условием того, чтобы х и у были связаны степенной зависимостью является: .
7. Определение параметров эмпирических формул
Существует два основных метода определения параметров эмпирических формул: интерполяция экстраполяция табличный
- метод средних;
- метод наименьших квадратов.
Широкое использование ЭВМ в процессе обработки экспериментальных данных позволяет проводить большой объем вычислений. Это и обусловило предпочтительное применение МНК, поскольку он дает большую точность приближения.
Однако не следует забывать о методе средних. Он основан на допущении, что наиболее подходящей формулой будет та, для которой алгебраическая сумма отклонений равна нулю.
8. Порядок действий при использовании метода средних
1. Выбрать тип эмпирической формулы.
2. Подставить в нее все пары экспериментальных значений.
3. Полученные уравнения разбить на группы, число которых равно числу параметров (желательно, чтобы число уравнений в каждой группе было одинаковым).
4. Складываем полученные уравнения каждой группы.
5. Решаем систему относительно параметров. Получаем требуемое уравнение.
Пример: Имеем экспериментально полученные значения (табл. 5):
- давление насыщенного пара (кг/см 2 )
- удельный объем (м 3 /кг).
Таблица 5 Экспериментально полученные значения
У |
0.482 |
1.034 |
2.0720 |
2.2470 |
7.1640 |
11.480 |
17.600 |
|
Х |
3.334 |
1.630 |
0.8657 |
0.4323 |
0.2646 |
0.1699 |
0.1146 |
|
Можно убедиться, что лучше выбрать в качестве эмпирической формулы зависимость типа:
т.к.
(находим линейной интерполяцией).
Таким образом:
; примем, что
Вычислим :
Построив точки можно убедиться, что они на одной прямой.
Таким образом, тип эмпирической формулы выбран правильно. Далее методом средних определяем параметры а и b .
Таблица 6 Вычисленные значения
0.5229 |
0.2122 |
-0.0626 |
-0.3642 |
-0.5774 |
-0.7698 |
-0.9408 |
||
-0.317 |
0.0145 |
0.3068 |
0.3516 |
0.8551 |
1.0599 |
1.2455 |
||
Составим систему уравнений:
Получаем: