\documentclass{article}
\usepackage[cp866]{inputenc}
\usepackage[russian, russianb]{babel}
\usepackage{amsmath}
\usepackage{amsfonts}
\usepackage{amssymb}


\newtheorem{thm}{Теорема}[section]
\newtheorem{example}{Пример}[section]
\newtheorem{co}{Следствие}[section]
\newtheorem{re}{Замечание}[section]
\newtheorem{pr}{Утверждение}[section]
\newtheorem{de}{Определение}[section]
\renewcommand{\theequation}{\arabic{section}.\arabic{equation}}
\newcommand{\go}[1]{\mathfrak{#1}}
\def\binom#1#2{{#1}\choose{#2}}
\newcommand{\R}{{\rm I}\kern-0.18em{\rm R}}
\newcommand{\E}{{\rm I}\kern-0.18em{\rm E}}
\newcommand{\p}{{\rm I}\kern-0.18em{\rm P}}

\title{Один класс многомерных статистических критериев, свободных от
распределения \thanks{Работа была поддержана грантами РФФИ 02-01-00262
и 02-01-00483}}
\author{Клебанов Л.Б.}
\date{}
\begin{document}
\maketitle
\par
\begin{flushright}Посвящается Абраму Ароновичу Зингеру к его 75-ти летию.
\end{flushright}
\par
\vspace{0.3cm}
\begin{abstract}
Предложен довольно широкий класс свободных от распределения
многомерных статистических критериев, основанных на использовании отрицательно
определенных ядер. Конструкция близка к введенным и использованным нами ранее
вероятностным метрикам (см. \cite{ZKK, ZK, KKRV, Kl}) и пригодна также для
случая распределений в гильбертовом и некоторых других пространствах. Указаны
критерии для проверки однородности, принадлежности аддитивному типу,
нормальности с неизвестными параметрами, и родственных гипотез.
\end{abstract}
\par
\vspace{0.2cm}
AMS Subject Classification: 62G10 Nonparametric inference. Hypothesis testing.
\par
\vspace{0.2cm}
Ключевые слова: свободные от распределения многомерные критерии, вероятностные
метрики, отрицательно определенные ядра.
\par
\setcounter{equation}{0}
\section{Предварительные сведения}
\par
Напомним сначала определение отрицательно определенного ядра.
\par
\begin{de}
\label{neg def}
Пусть $\go{X}$ -- некоторое множество, а $\mathcal{L}(x,y)$ -- комплексно-значная
функция, определенная на $\go{X}^2$. $\mathcal{L} (x,y)$ называется
отрицательно определенным ядром, если неравенство
\begin{equation}
\label{in_1}
\sum_{s=1}^{n}\sum_{t=1}^{n}\mathcal{L}(x_s,x_t)h_s\overline{h_t} \leq 0
\end{equation}
выполнено для любых целых $n \geq 1$, любых точек $x_1,\ldots,x_n \in \go{X}$
и любых комплексных чисел $h_1,\cdots,h_n$, удовлетворяющих условию $\sum_{j=1}^{n}h_j=0$.
\end{de}
\par
\begin{de}
\label{strict ne}
Ядро $\mathcal{L}(x,y)$ называется строго отрицательно определенным, если равенство
в (\ref{in_1}) достигается тогда и только тогда, когда $h_j=0$ for all $j=1,\ldots,n$.
\end{de}
\par
Если  $\mathcal{L}(x,y)$ принимает вещественные значения и для любых $x,y \in \go{X}$
\begin{equation}
\label{sym}
\mathcal{L}(x,y)=\mathcal{L}(y,x),
\end{equation}
то в (\ref{in_1}) достаточно выбырать только вещественные $h_j$.
\par
Далее мы предполагаем, что $\go{X}$ - метрическое пространство с
метрикой ${\bf d}$. Обозначим $\go{A}$ $\sigma$-алгебру всех
борелевских подмножеств $\go{X}$.
Говоря далее об отрицательно определенных ядрах мы всегда будем предполагать,
что они непрерывны и принимают вещественные значения.
\par
Напомним теперь некоторые результаты о расстояниях, порожденных отрицательно
определенными ядрами.
\par
\begin{thm}
\label{theo1}
Пусть $\mathcal{L}(x,y)$ - вещественная непрерывная функция, заданная на $\go{X}^2$
и удовлетворяющая $\mathcal{L}(x,y)=\mathcal{L}(y,x)$. Неравенство
\begin{equation}
\label{theo1_1}
2\E\mathcal{L}(X,Y) -\E\mathcal{L}(X,X^{\prime}) -\E\mathcal{L}(Y,Y^{\prime}) \geq 0
\end{equation}
имеет место для всех независимых в совокупности случайных величин $X,X',Y,Y'$
со значениями в $(\go{X},\go{A})$ и удовлетворяющими
\begin{eqnarray}
\label{theo1_2}
 X \stackrel{d}{=} X',  \qquad &  & E\mathcal{L}(X,X') < \infty, \nonumber   \\
 Y \stackrel{d}{=} Y',  \qquad &  & E\mathcal{L}(Y,Y') < \infty
\end{eqnarray}
тогда и только тогда,когда $\mathcal{L}$ предстваляет собой отрицательно
определенное ядро (знак $\stackrel{d}{=}$ используется нами для обозначения
равенства распределений).
\end{thm}
\par
Доказательство было получено в \cite{ZKK}.
\par
Отметим, что определение отрицательно определенного ядра, удовлетворяющего (\ref{theo1_2})
может быть переписано в эквивалентном виде как
\begin{equation}
\label{theo1_3}
\int_{\go{X}}\int_{\go{X}}\mathcal{L}(x,y)h(x)h(y)dQ(x)dQ(y) \leq 0
\end{equation}
для любой вероятостной меры $Q$ на $(\go{X},\go{A})$ и любой интегрируемой
функции $h(x)$, для которой $\int_{\go{X}}h(x)dQ(x)=0$.
\par
\begin{de}
\label{strong ne}
Допустим, что нам дана вероятностная мера  $Q$ на $(\go{X},\go{A})$
и предположм, что $h(x)$- функция, интегрируемая по мере $Q$ и такая, что
$\int_{\go{X}}h(x)dQ(x)=0$. Скажем, что $\mathcal{L}$ - сильно орицательно определенное
ядро, если $\mathcal{L}$ является отрицательно определенным ядром и равенство
\begin{equation*}
\int_{\go{X}}\int_{\go{X}}\mathcal{L}(x,y)h(x)h(y)dQ(x)dQ(y) =  0
\end{equation*}
влечет $h(x)=0$ $Q$-почт всюду, не зависимо от выбора меры $Q$.
\end{de}
Положим
\[ \mathcal{N}(X,Y) = 2\E\mathcal{L}(X,Y) -\E\mathcal{L}(X,X^{\prime}) -\E\mathcal{L}(Y,Y^{\prime}). \]
Для сильно отрицательно определенного ядра $\mathcal{L}$
$\mathcal{N}(X,Y)$ представляет собой квадрат расстояния в
пространстве функций распределения случайных величин, удовлетворяющих
условиям (\ref{theo1_2}). Таким образом, если ядро $\mathcal{L}$
является сильно отрицательно определенным, то $\mathcal{N}(X,Y) =0$
эквивалентно условию $X \stackrel{d}{=} Y$.
\par
Приведем некоторые примеры сильно отрицательно определенных ядер.
\par
\begin{example} \label{examp1}
Пусть $\go{X}$ - сепарабельное гильбертово пространство. Допустим, что $f(t)$ -
вещественная характеристическая функция безгранично делимой меры на $\go{X}$.
Тогда $\mathcal{L}(t)=-\log f(t)$ - отрицательно определенная функция на $\go
X$ т.е., $\mathcal{L}(x-y), x,y \in X$ - отрицательно определенное ядро. Если
носитель распределения, соответствующего $f(t)$ совпадает со всем
пространством $\go{X}$, то $\mathcal{L}(x-y), x,y \in X$ -  сильно
отрицательно определенное ядро.
\end{example}
\par
\begin{example} \label{examp2}
Мы знаем, что
\begin{equation*} \mathcal{L}(t) =  \frac{1}{2}(Bt,t)-
\int_{\go {X}}^{}\Bigl(e^{i(t,x)}-1-\frac{i(t,x)}{1+\|x\|^{2}}\Bigr)
\frac{1+\|x\|^{2}}{\|x\|^{2}}d\theta(x) ,
\end{equation*}
где $B$ - ядерный оператор и $\theta$ - конечная мера на $\go{X}$ такая,
что $\theta(\{0\})=0$. Ясно, что если $\mathrm{supp} \theta=X$,
то $\mathcal{L}$ - сильно отрицательно определенная функция на $\go{X}$,
т.е. $\mathcal{L}(x-y)$ - сильно отрицательно определенное ядро.
\end{example}
\par
В частности, $\|z\|^r$ для $z \in \R^d$ является {\it отрицательно определенной функцией для
$r \in [0,2]$} и {\it сильно отрицательно определенной для $r \in (0,2)$}.
\par

\setcounter{equation}{0}
\section{Многомерный критерий однородности}\label{main}
\par
Пусть $X$, $Y$ - два независимых случайных вектора в $\R^d$. Определим одномерные
случайные величины $U$ и $V$, положив
\begin{gather}
U=\mathcal{L}(X-Y)-\mathcal{L}(X-X'), \notag\\
V=\mathcal{L}(Y'-Y'')-\mathcal{L}(X''-Y'').
\end{gather}
Здесь $X \stackrel{d}{=}X'\stackrel{d}{=}X''$, $Y \stackrel{d}{=}Y'\stackrel{d}{=}Y''$,
причем векторы $X,X',X'',Y,Y',Y''$ независимы в совокупности.
\par
Ясно, что условие $\mathcal{N}(X,Y) = 0$ эквивалентно равенству $\E U = \E V$.
Однако
\[ \mathcal{N}(X,Y) = 0 \; \Longleftrightarrow \; X \stackrel{d}{=} Y \; \Longrightarrow \; U \stackrel{d}{=} V. \]
Поэтому, при условии (\ref{theo1_2}),
\begin{equation}
\label{equiv}
X \stackrel{d}{=} Y \; \Longleftrightarrow \; U \stackrel{d}{=} V,
\end{equation}
т.е. гипотеза одинаковой распределенности случайных векторов $X$ и $Y$ эквивалентна
гипотезе одинаковой распределенности одномерных случайных величин $U$ и $V$.
Для проверки этой последней гипотезы можно использовать любые известные одномерные
свободные от распределения критерии, например, критерий Колмогорова-Смирнова.
Разумеется, в случае непрерывных распределений векторов $X$ и $Y$ распределения
величин $U$ и $V$ также будут непрерывными, и критерий одинаковой
распределенности $X$ и $Y$, полученный путем применения критерия
Колмогорова-Смирнова к $U$ и $V$, окажется свободным от рапределения.
\par
Пусть $X_1, \ldots ,X_n$, $Y_1, \ldots ,Y_n$ -- независимые повторные выборки
из генеральных совокупностей $X$ и $Y$, соответственно. Для применения одномерного
критерия к величинам $U$ и $V$ нам нужно построить выборки из этих совокупностей,
основываясь на данных $X_1, \ldots ,X_n$, $Y_1, \ldots ,Y_n$. Это можно сделать
по крайней мере двумя путями.
\par
Один состоит в том чтобы разбить каждую из
выборок на три равные части, и по каждую из частей рассматривать как выборку
из $X$, $X'$, $X''$, и, соответственно, из $Y$, $Y'$, $Y''$. Разумеется, этот
способ приводит к потере информации, но является теоретически безупречным.
Разумеется, он приводит к построению свободного от распределения критерия
однородности.
\par
Второй (довольно естественный) подход состоит в том, что мы можем сгенерировать
выборки из совокупностей $X'$, $X''$ (а также $Y'$, $Y''$), проводя независимые
выборы среди наблюдений $X_1, \ldots ,X_n$ (соответсвенно, $Y_1, \ldots ,Y_n$).
Теоретически этот путь уже не является безукоризненным, так как гипотеза о
совпадении генеральных распределений $X$ и $Y$ заменяется гипотезой о
совпадении соответствующих эмпирических распределений. Поэтому полученный
критерий, очевидно, окажется асимптотически (при $n \to \infty$) свободным
от распределения, но, вообще говоря, не будет таковым при фиксированном $n$.
Мы проводили компьютерую симуляцию, которая показала, что эффект отсутствия
свободы от распределения в этом случае является практически незаметным при выборках,
объема $n \geq 30$.
\par
\setcounter{equation}{0}
\section{Проверка принадлежности распределений одному аддитивному типу}
\par
Пусть $z_1, \ldots , z_k$ ($k \geq 3$ ) - независимые одинаково распределенные
случайные векторы в $\R^m$ с функцией распределения $F(x)$. Рассмотрим вектор
разностей $Z=(z_2-z_1, \ldots , z_k-z_1)$. Ясно, что распределение этого вектора
не измениться, если ко всем $z_j$ ($j=1, \ldots , k$) прибавить один и тот же
постоянный вектор $\theta \in \R^m$. Иными словами, распределение $Z$ одно и тоже для
аддитивного типа $F$, т.е. для всех функций распределения вида $F(x-\theta)$.
Задача о восстановлении аддитивного типа распределения по распределению инварианта
$Z$ была рассмотрена в \cite{Kov}, где было показано, что восстановление единственно
при условии отсутсвия нулей у характеристической функции, соответствующей $F(x)$.
Условие отсутсвия нулей может быть заменено требованием аналитичности этой
характеристической функции.
\par
Основываясь на указанном выше результате можно построить критерий проверки гипотезы
о том что две выборки сделаны из одного и того же аддитивного типа распределения.
\par
Пусть $X_1, \ldots ,X_n$, $Y_1, \ldots ,Y_n$ -- независимые повторные выборки
из генеральных совокупностей $X$ и $Y$, соответственно. Мы хотим проверить гипотезу
о том, что $X\stackrel{d}{=}Y+\theta$ при некотором постоянном неизвестном векторе
$\theta$ против альтеративы $X\stackrel{d}{\neq}Y+\theta$ при всех $\theta$.
Для построения критерия мы можем поступить следующим образом:
\begin{enumerate}
\begin{item}
Путем независимого выбора из значений $X_1, \ldots ,X_n$ генерируем
$X'_1, \ldots ,X'_n$ и $X''_1, \ldots ,X''_n$.
\end{item}
\begin{item}
Путем независимого выбора из значений $Y_1, \ldots ,Y_n$ генерируем
$Y'_1, \ldots ,Y'_n$ и $Y''_1, \ldots ,Y''_n$.
\end{item}
\begin{item}
Формируем векторные выборки
\[ Z_X=((X'_1-X_1,X''_1-X_1), \ldots , (X'_n-X_n,X''_n-X_n)) \]
и
\[ Z_Y=((Y'_1-Y_1,Y''_1-Y_1), \ldots , (Y'_n-Y_n,Y''_n-Y_n)). \]
\end{item}
\begin{item}
Используя технику предыдущего раздела проверяем гипотезу о том, что выборки
$Z_X$ и $Z_Y$ извлечены из одной совокупности. В силу результатов Коваленко
\cite{Kov} эта гипотеза эквивалентна (в предположении отсутсвия нулей у
характеристической функции наблюдений) гипотезе о принадлежности наблюдений
одному аддитивному типу.
\end{item}
\end{enumerate}
Ясно, что приведенная методика хороша только асимптотически, так как имеет
дефект, связанный с выбором из наблюденных значений. Избежать его снова можно
деля исходные выборки на соответсвующее число частей.
\par
\setcounter{equation}{0}
\section{Провека нормальности наблюдений}
\par
Определенный интерес с практической точки зрения представляет собой проверка
гипотезы о нормальности векторных наблюдений, причем с неизвестными вектором
средних и матрицей ковариаций. Проверка этой гипотезы может быть основана
на следующей характеризации нормального закона (см., например, \cite{KKM}).
\begin{pr} \label{pr_ch}
Пусть $Z, Z', Z'', Z'''$ - четыре независимых одинаково распределенных случайных
вектора в $\R^d$. Вектор $Z$ имеет гауссовское распределение тогда и только
тогда, когда
\begin{equation}
\label{ch_1}
Z \stackrel{d}{=} \frac{2}{3} Z'+\frac{2}{3}Z''-\frac{1}{3}Z'''.
\end{equation}
\end{pr}
Пусть $Z_1, \ldots ,Z_n$ - повторная выборка из генеральной совокупности $Z$.
Критерий проверки гауссовости $Z$ может быть основан на ледующей процедуре:
\begin{enumerate}
\begin{item}
Путем независимого выбора из значений $Z_1, \ldots ,Z_n$ генерируем
$Z'_1, \ldots ,Z'_n$, $Z''_1, \ldots ,Z''_n$ и $Z'''_1, \ldots ,Z'''_n$.
\end{item}
\begin{item}
\end{item}
\begin{item}
Формируем выборки
\[ X=(Z_1, \ldots ,Z_n)) \]
и
\[ Y=((\frac{2}{3} Z'_1+\frac{2}{3}Z''_1-\frac{1}{3}Z'''_1), \ldots , (\frac{2}{3} Z'_n+\frac{2}{3}Z''_n-\frac{1}{3}Z'''_n)). \]
\end{item}
\begin{item}
Используя результаты раздела \ref{main}, проверяем гипотезу однородности для
$X$ и $Y$. В силу Утверждения \ref{pr_ch} эта гипотеза эквивалентна гипотезе
о нормальности $Z$ с произвольными (неизвестными) параметрами.
\end{item}
\end{enumerate}

В заключение заметим, что предлагаемая методика может быть использована для
построения критериев проверки независимости, симметрии (см. \cite{ZK}),
сферической симметрии (см. \cite{KKRV}), и некоторых других.

\begin{thebibliography}{99}
\bibitem{ZKK}
Зингер А.А., Какосян А.В., Клебанов Л.Б.
Характеризация распределений с помощью средних значений некоторых статистик в
связи с некоторыми вероятностными метриками,
Проблемы устойчивости стохастических моделей, ВНИИ системных исследований,
Москва, 1989, с. 47-55.

\bibitem{ZK}
Зингер А.А., Клебанов Л.Б.
Характеризация симметрии распределений свойствами моментов,
Проблемы устойчивости стохастических моделей, ВНИИ системных исследований,
Москва, 1991, с. 70-72.

\bibitem{KKM}
Kakosyan A.V., Klebanov L.B., Melamed J.A.
Characterization of Distributions by the Method of Intensively Monotone
Operators,
Lecture Notes in Mathematics, 1088, Springer-Verlag, Berlin, 1984.

\bibitem{KKRV}
Klebanov L.B., Kozubovskii T., Rachev S.T., Volkovich V.
Characterization of Distributions Symmetric With Respect to a Group
of Transformations and Testing of Corresponding Statistical Hypothesis.
Statistics \& Probability Letters, v. 53, No 3, 2001, 241-247.

\bibitem{Kl}
Klebanov L.B.
A class of Probability Metrics and its Statistical Applications,
Statistics in Industry and Technology: Statistical Data Analysis,
Yadolah Dodge, Ed. Birkhauser, Basel, Boston, Berlin, 2002, 241-252.

\bibitem{Kov}
Kovalenko I.N.
О восстановлении аддитивного типа распределения по
последовательным независимым экспериментам,
Труды Всесоюзного совещания по теории вероятностей и
математической статистике, Ереван, 1960.

\end{thebibliography}
\end{document}

