«Cоздание нескольких потоков и управление ими в Python» и «Recover Deleted Files on an NTFS Hard Drive from a Linux»: разница между страницами

Версия от 23:39, 25 сентября 2017

To undelete our files, we first need to identify the hard drive that we want to undelete from. In the terminal window, type in:

sudo fdisk –l

and press enter.

sshot-2

What you’re looking for is a line that ends with HPSF/NTFS (under the heading System). In our case, the device is “/dev/sda1”. This may be slightly different for you, but it will still begin with /dev/. Note this device name.

If you have more than one hard drive partition formatted as NTFS, then you may be able to identify the correct partition by the size. If you look at the second line of text in the screenshot above, it reads “Disk /dev/sda: 136.4 GB, …” This means that the hard drive that Ubuntu has named /dev/sda is 136.4 GB large. If your hard drives are of different size, then this information can help you track down the right device name to use. Alternatively, you can just try them all, though this can be time consuming for large hard drives.

Now that you know the name Ubuntu has assigned to your hard drive, we’ll scan it to see what files we can uncover.

In the terminal window, type:

sudo ntfsundelete <HD name>

and hit enter. In our case, the command is:

sudo ntfsundelete /dev/sda1

sshot-3

The names of files that can recovered show up in the far right column. The percentage in the third column tells us how much of that file can be recovered. Three of the four files that we originally deleted are showing up in this list, even though we shut down the computer right after deleting the four files – so even in ideal cases, your files may not be recoverable.

Nevertheless, we have three files that we can recover – two JPGs and an MPG.

Note: ntfsundelete is immediately available in the Ubuntu 9.10 Live CD. If you are in a different version of Ubuntu, or for some other reason get an error when trying to use ntfsundelete, you can install it by entering “sudo apt-get install ntfsprogs” in a terminal window.

To quickly recover the two JPGs, we will use the * wildcard to recover all of the files that end with .jpg.

In the terminal window, enter

sudo ntfsundelete <HD name> –u –m *.jpg

which is, in our case,

sudo ntfsundelete /dev/sda1 –u –m *.jpg

sshot-10

The two files are recovered from the NTFS hard drive and saved in the current working directory of the terminal. By default, this is the home directory of the current user, though we are working in the Desktop folder.

Note that the ntfsundelete program does not make any changes to the original NTFS hard drive. If you want to take those files and put them back in the NTFS hard drive, you will have to move them there after they are undeleted with ntfsundelete. Of course, you can also put them on your flash drive or open Firefox and email them to yourself – the sky’s the limit!

We have one more file to undelete – our MPG.

sshot-4

Note the first column on the far left. It contains a number, its Inode. Think of this as the file’s unique identifier. Note this number.

To undelete a file by its Inode, enter the following in the terminal:

sudo ntfsundelete <HD name> –u –i <Inode>

In our case, this is:

sudo ntfsundelete /dev/sda1 –u –i 14159

sshot-11

This recovers the file, along with an identifier that we don’t really care about. All three of our recoverable files are now recovered.

Resurses:

Recover Deleted Files on an NTFS Hard Drive from a Ubuntu Live CD

Аноним

Поиск

«Cоздание нескольких потоков и управление ими в Python» и «Recover Deleted Files on an NTFS Hard Drive from a Linux»: разница между страницами

Пространства имён

Ещё

Действия на странице

Версия от 23:39, 25 сентября 2017

Навигация

СИСТЕМЫ

РАЗРАБОТКА

ТЕХНОЛОГИИ

ИНСТРУМЕНТЫ

Навигация

Вики-инструменты

Вики-инструменты

@@ Строка 1: / Строка 1: @@
-== О потоках управления ==
+To undelete our files, we first need to identify the hard drive that we want to undelete from. In the terminal window, type in:
+ sudo fdisk –l
-В современной операционной системе, даже не выполняющей ничего особенного, могут одновременно работать несколько процессов (processes). Например, при запуске программы запускается новый процесс. Функции для управления процессами можно найти в стандартном модуле os языка Python. Здесь же речь пойдет о потоках.
+ and press enter.
-Потоки управления (threads) образуются и работают в рамках одного процесса. В однопоточном приложении (программе, которая не использует дополнительных потоков) имеется только один поток управления. Говоря упрощенно, при запуске программы этот поток последовательно исполняет встречаемые в программе операторы, направляясь по одной из альтернативных ветвей оператора выбора, проходит через тело цикла нужное число раз, выбирается к месту обработки исключения при возбуждении исключения. В любой момент времени интерпретатор Python знает, какую команду исполнить следующей. После исполнения команды становится известно, какой команде передать управление. Эта ниточка непрерывна в ходе выполнения программы и обрывается только по ее завершении.
+ sshot-2
-Теперь можно представить себе, что в некоторой точке программы ниточка раздваивается, и каждый поток идет своим путем. Каждый из образовавшихся потоков может в дальнейшем еще несколько раз раздваиваться. (При этом один из потоков всегда остается главным, и его завершение означает завершение всей программы.) В каждый момент времени интерпретатор знает, какую команду какой поток должен выполнить, и уделяет кванты времени каждому потоку. Такое, казалось бы, незначительное усложнение механизма выполнения программы на самом деле требует качественных изменений в программе - ведь деятельность потоков должна быть согласована. Нельзя допускать, чтобы потоки одновременно изменяли один и тот же объект, результат такого изменения, скорее всего, нарушит целостность объекта.
+What you’re looking for is a line that ends with HPSF/NTFS (under the heading System). In our case, the device is “/dev/sda1”. This may be slightly different for you, but it will still begin with /dev/. Note this device name.
-Одним из классических средств согласования потоков являются объекты, называемые семафорами. Семафоры не допускают выполнения некоторого участка кода несколькими потоками одновременно. Самый простой семафор - замок (lock) или mutex (от английского mutually exclusive, взаимоисключающий). Для того чтобы поток мог продолжить выполнение кода, он должен сначала захватить замок. После захвата замка поток выполняет определенный участок кода и потом освобождает замок, чтобы другой поток мог его получить и пройти дальше к выполнению охраняемого замком участку программы. Поток, столкнувшись с занятым другим потоком замком, обычно ждет его освобождения.
+If you have more than one hard drive partition formatted as NTFS, then you may be able to identify the correct partition by the size. If you look at the second line of text in the screenshot above, it reads “Disk /dev/sda: 136.4 GB, …” This means that the hard drive that Ubuntu has named /dev/sda is 136.4 GB large. If your hard drives are of different size, then this information can help you track down the right device name to use. Alternatively, you can just try them all, though this can be time consuming for large hard drives.
-Поддержка многопоточности в языке Python доступна через использование ряда модулей. В стандартном модуле threading определены нужные для разработки многопоточной (multithreading) программы классы: несколько видов семафоров (классы замков Lock, RLock и класс Semaphore ) и другие механизмы взаимодействия между потоками (классы Event и Condition ), класс Timer для запуска функции по прошествии некоторого времени. Модуль Queue реализует очередь, которой могут пользоваться сразу несколько потоков. Для создания и (низкоуровневого) управления потоками в стандартном модуле thread определен класс Thread.
+Now that you know the name Ubuntu has assigned to your hard drive, we’ll scan it to see what files we can uncover.
+In the terminal window, type:
-=== Пример многопоточной программы ===
+ sudo ntfsundelete <HD name>
+and hit enter. In our case, the command is:
-В следующем примере создается два дополнительных потока, которые выводят на стандартный вывод каждый свое:
+ sudo ntfsundelete /dev/sda1
- import threading
+sshot-3
-            def proc(n):
-              print "Процесс", n
-            p1 = threading.Thread(target=proc, name="t1", args=["1"])
-            p2 = threading.Thread(target=proc, name="t2", args=["2"])
-            p1.start()
-            p2.start()
-Сначала получается два объекта класса Thread, которые затем и запускаются с различными аргументами. В данном случае в потоках работает одна и та же функция proc(), которой передается один аргумент, заданный в именованном параметре args конструктора класса Thread. Нетрудно догадаться, что метод start() служит для запуска нового потока. Таким образом, в приведенном примере работают три потока: основной и два дополнительных (с именами "t1" и "t2" ).
-== Функции модуля threading ==
+The names of files that can recovered show up in the far right column. The percentage in the third column tells us how much of that file can be recovered. Three of the four files that we originally deleted are showing up in this list, even though we shut down the computer right after deleting the four files – so even in ideal cases, your files may not be recoverable.
+Nevertheless, we have three files that we can recover – two JPGs and an MPG.
-В модуле threading, который здесь используется, есть функции, позволяющие получить информацию о потоках:
+Note: ntfsundelete is immediately available in the Ubuntu 9.10 Live CD. If you are in a different version of Ubuntu, or for some other reason get an error when trying to use ntfsundelete, you can install it by entering “sudo apt-get install ntfsprogs” in a terminal window.
-activeCount() Возвращает количество активных в настоящий момент экземпляров класса Thread. Фактически, это len(threading.enumerate()).
+To quickly recover the two JPGs, we will use the * wildcard to recover all of the files that end with .jpg.
-currentThread() Возвращает текущий объект-поток, то есть соответствующий потоку управления, который вызвал эту функцию. Если поток не был создан через модуль threading, будет возвращен объект-поток с сокращенной функциональностью (dummy thread object).
-enumerate() Возвращает список активных потоков. Завершившиеся и еще не начатые потоки не входят в список.
-Класс Thread
-Экземпляры класса threading.Thread представляют потоки Python-программы. Задать действия, которые будут выполняться в потоке, можно двумя способами: передать конструктору класса исполняемый объект и аргументы к нему или путем наследования получить новый класс с переопределенным методом run(). Первый способ был рассмотрен в примере выше. Конструктор класса threading.Thread имеет следующие аргументы:
+In the terminal window, enter
-Thread(group, target, name, args, kwargs)
+ sudo ntfsundelete <HD name> –u –m *.jpg
-Здесь group - группа потоков (пока что не используется, должен быть равен None ), target - объект, который будет вызван в методе run(), name - имя потока, args и kwargs - последовательность и словарь позиционных и именованных параметров (соответственно) для вызова заданного в параметре target объекта. В примере выше были использованы только позиционные параметры, но то же самое можно было выполнить и с применением именованных параметров:
- import threading
+which is, in our case,
-            def proc(n):
-              print "Процесс", n
-            p1 = threading.Thread(target=proc, name="t1", kwargs={"n": "1"})
-            p2 = threading.Thread(target=proc, name="t2", kwargs={"n": "2"})
-            p1.start()
-            p2.start()
-То же самое можно проделать через наследование от класса threading.Thread с определением собственного конструктора и метода run():
+ sudo ntfsundelete /dev/sda1 –u –m *.jpg
- import threading
+sshot-10
-            class T(threading.Thread):
-              def __init__(self, n):
-                threading.Thread.__init__(self, name="t" + n)
-                self.n = n
-              def run(self):
-                print "Процесс", self.n
-            p1 = T("1")
-            p2 = T("2")
-            p1.start()
-            p2.start()
-Самое первое, что необходимо сделать в конструкторе - вызвать конструктор базового класса. Как и раньше, для запуска потока нужно выполнить метод start() объекта-потока, что приведет к выполнению действий в методе run().
+The two files are recovered from the NTFS hard drive and saved in the current working directory of the terminal. By default, this is the home directory of the current user, though we are working in the Desktop folder.
-Жизнью потоков можно управлять вызовом методов:
+Note that the ntfsundelete program does not make any changes to the original NTFS hard drive. If you want to take those files and put them back in the NTFS hard drive, you will have to move them there after they are undeleted with ntfsundelete. Of course, you can also put them on your flash drive or open Firefox and email them to yourself – the sky’s the limit!
-*start() Дает потоку жизнь.
+We have one more file to undelete – our MPG.
-*run() Этот метод представляет действия, которые должны быть выполнены в потоке.
-*join([timeout]) Поток, который вызывает этот метод, приостанавливается, ожидая завершения потока, чей метод вызван. Параметр timeout (число с плавающей точкой) позволяет указать время ожидания (в секундах), по истечении которого приостановленный поток продолжает свою работу независимо от завершения потока, чей метод join был вызван. Вызывать join() некоторого потока можно много раз. Поток не может вызвать метод join() самого себя. Также нельзя ожидать завершения еще не запущенного потока. Слово "join" в переводе с английского означает "присоединить", то есть, метод, вызвавший join(), желает, чтобы поток по завершении присоединился к вызывающему метод потоку.
-*getName() Возвращает имя потока. Для главного потока это "MainThread".
-*setName(name) Присваивает потоку имя name.
-*isAlive() Возвращает истину, если поток работает (метод run() уже вызван, но еще не завершился).
-*isDaemon() Возвращает истину, если поток имеет признак демона. Программа на Python завершается по завершении всех потоков, не являющихся демонами. Главный поток демоном не является.
-*setDaemon(daemonic) Устанавливает признак daemonic того, что поток является демоном. Начальное значение этого признака заимствуется у потока, запустившего данный. Признак можно изменять только для потоков, которые еще не запущены.
-В модуле Thread пока что не реализованы возможности, присущие потокам в Java (определение групп потоков, приостановка и прерывание потоков извне, приоритеты и некоторые другие вещи), однако они, скорее всего, будут созданы в недалеком будущем.
+sshot-4
-== Таймер ==
+Note the first column on the far left. It contains a number, its Inode. Think of this as the file’s unique identifier. Note this number.
+To undelete a file by its Inode, enter the following in the terminal:
-Класс threading.Timer представляет действие, которое должно быть выполнено через заданное время. Этот класс является подклассом класса threading.Thread, поэтому запускается также методом start(). Следующий простой пример, печатающий на стандартном выводе Hello, world! поясняет сказанное:
+ sudo ntfsundelete <HD name> –u –i <Inode>
- def hello():
+In our case, this is:
-              print "Hello, world!"
-            t = Timer(30.0, hello)
-            t.start()
+ sudo ntfsundelete /dev/sda1 –u –i 14159
-== Замки ==
+sshot-11
+This recovers the file, along with an identifier that we don’t really care about. All three of our recoverable files are now recovered.
-Простейший замок может быть реализован на основе класса Lock модуля threading. Замок имеет два состояния: он может быть или открыт, или заперт. В последнем случае им владеет некоторый поток. Объект класса Lock имеет следующие методы:
+<hr>
+'''Resurses:'''
-acquire([blocking=True]) Делает запрос на запирание замка. Если параметр blocking не указан или является истиной, то поток будет ожидать освобождения замка. Если параметр не был задан, метод не возвратит значения. Если blocking был задан и истинен, метод возвратит True (после успешного овладения замком). Если блокировка не требуется (то есть задан blocking=False ), метод вернет True, если замок не был заперт и им успешно овладел данный поток. В противном случае будет возвращено False.
+<hr>
-release() Запрос на отпирание замка.
+* [https://www.howtogeek.com/howto/13706/recover-deleted-files-on-an-ntfs-hard-drive-from-a-ubuntu-live-cd/ Recover Deleted Files on an NTFS Hard Drive from a Ubuntu Live CD]
-locked() Возвращает текущее состояние замка ( True - заперт, False - открыт). Следует иметь в виду, что даже если состояние замка только что проверено, это не означает, что он сохранит это состояние до следующей команды.
-Имеется еще один вариант замка - threading.RLock, который отличается от threading.Lock тем, что некоторый поток может запрашивать его запирание много раз. Отпирание такого замка должно происходить столько же раз, сколько было запираний. Это может быть полезно, например, внутри рекурсивных функций.
-=== Когда нужны замки? ===
-Замки позволяют ограничивать вход в некоторую область программы одним потоком. Замки могут потребоваться для обеспечения целостности структуры данных. Например, если для корректной работы программы требуется добавление определенного элемента сразу в несколько списков или словарей, такие операции в многопоточном приложении следует обставить замками. Вокруг атомарных операций над встроенными типами (операций, которые не вызывают исполнение какого-то другого кода на Python) замки ставить необязательно. Например, метод append() (встроенного) списка является атомарной операцией, а тот же метод, реализованный пользовательским классом, может требовать блокировок. В случае сомнений, конечно, лучше перестраховаться и поставить замки, однако следует минимизировать общее время действия замка, так как замок останавливает другие потоки, пытающиеся попасть в ту же область программы. Отсутствие замка в критической части программы, работающей над общими для двух и более потоков ресурсами, может привести к случайным, трудноуловимым ошибкам.
-== Тупиковая ситуация (deadlock) ==
-Замки применяются для управления доступом к ресурсу, который нельзя использовать совместно. В программе таких ресурсов может быть несколько. При работе с замками важно хорошо продумать, не зайдет ли выполнение программы в тупик (deadlock) из-за того, что двум потокам потребуются одни и те же ресурсы, но ни тот, ни другой не смогут их получить, так как они уже получили замки. Такая ситуация проиллюстрирована в следующем примере:
- import threading, time
-                resource = {'A': threading.Lock(), 'B': threading.Lock()}
-                def proc(n, rs):
-                 for r in rs:
-                   print "Процесс %s запрашивает ресурс %s" % (n, r)
-                   resource[r].acquire()
-                   print "Процесс %s получил ресурс %s" % (n, r)
-                   time.sleep(1)
-                 print "Процесс %s выполняется" % n
-                 for r in rs:
-                   resource[r].release()
-                 print "Процесс %s закончил выполнение" % n
-                p1 = threading.Thread(target=proc, name="t1", args=["1", "AB"])
-                p2 = threading.Thread(target=proc, name="t2", args=["2", "BA"])
-                p1.start()
-                p2.start()
-                p1.join()
-                p2.join()
-В этом примере два потока (t1 и t2) запрашивают замки к одним и тем же ресурсам (A и B), но в разном порядке, отчего получается, что ни у того, ни у другого не хватает ресурсов для дальнейшей работы, и они оба безнадежно повисают, ожидая освобождения нужного ресурса. Благодаря операторам print можно увидеть последовательность событий:
- Процесс 1 запрашивает ресурс A
-                Процесс 1 получил ресурс A
-                Процесс 2 запрашивает ресурс B
-                Процесс 2 получил ресурс B
-                Процесс 1 запрашивает ресурс B
-                Процесс 2 запрашивает ресурс A
-Существуют методики, позволяющие избежать подобных тупиков, однако их рассмотрение не входит в рамки данной лекции. Можно посоветовать следующие приемы:
-*построить логику приложения так, чтобы никогда не запрашивать замки к двум ресурсам сразу. Возможно, придется определить составной ресурс. В частности, к данному примеру можно было бы определить замок "AB" для указания эксклюзивного доступа к ресурсам A и B.
-*строго упорядочить все ресурсы (например, по цене) и всегда запрашивать их в определенном порядке (скажем, начиная с более дорогих ресурсов). При этом перед заказом некоторого ресурса поток должен отказаться от заблокированных им более дешевых ресурсов.
-== Семафоры ==
-Семафоры (их иногда называют семафорами Дийкстры (Dijkstra) по имени их изобретателя) являются более общим механизмом синхронизации потоков, нежели замки. Семафоры могут допустить в критическую область программы сразу несколько потоков. Семафор имеет счетчик запросов, уменьшающийся с каждым вызовом метода acquire() и увеличивающийся при каждом вызове release(). Счетчик не может стать меньше нуля, поэтому в таком состоянии потокам приходится ждать, как и в случае с замками, пока значение счетчика не увеличится.
-Конструктор класса threading.Semaphore принимает в качестве (необязательного) аргумента начальное состояние счетчика (по умолчанию оно равно 1, что соответствует замку класса Lock ). Методы acquire() и release() действуют аналогично описанным выше одноименным методам у замков.
-Семафор может применяться для охраны ограниченного ресурса. Например, с его помощью можно вести пул соединений с базой данных. Пример такого использования семафора (заимствован из документации к Python) дан ниже:
- from threading import BoundedSemaphore
-            maxconnections = 5
-            # Подготовка семафора
-            pool_sema = BoundedSemaphore(value=maxconnections)
-            # Внутри потока:
-            pool_sema.acquire()
-            conn = connectdb()
-            # ... использование соединения ...
-            conn.close()
-            pool_sema.release()
-Таким образом, применяется не более пяти соединений с базой данных. В примере использован класс threading.BoundedSemaphore. Экземпляры этого класса отличаются от экземпляров класса threading.Semaphore тем, что не дают сделать release() больше, чем сделан acquire().
-== События ==
-Еще одним способом коммуникации между объектами являются события. Экземпляры класса threading.Event могут быть использованы для передачи информации о наступлении некоторого события от одного потока одному или нескольким другим потокам. Объекты-события имеют внутренний флаг, который может находиться в установленном или сброшенном состоянии. При своем создании флаг события находится в сброшенном состоянии. Если флаг в установленном состоянии, ожидания не происходит: поток, вызвавший метод wait() для ожидания события, просто продолжает свою работу. Ниже приведены методы экземпляров класса threading.Event:
-*set() Устанавливает внутренний флаг, сигнализирующий о наступлении события. Все ждущие данного события потоки выходят из состояния ожидания.
-*clear() Сбрасывает флаг. Все события, которые вызывают метод wait() этого объекта-события, будут находиться в состоянии ожидания до тех пор, пока флаг сброшен, или по истечении заданного таймаута.
-*isSet() Возвращает состояние флага.
-*wait([timeout]) Переводит поток в состояние ожидания, если флаг сброшен, и сразу возвращается, если флаг установлен. Аргумент timeout задает таймаут в секундах, по истечении которого ожидание прекращается, даже если событие не наступило.
-== Условия ==
-Более сложным механизмом коммуникации между потоками является механизм условий. Условия представляются в виде экземпляров класса threading.Condition и, подобно только что рассмотренным событиям, оповещают потоки об изменении некоторого состояния. Конструктор класса threading.Condition принимает необязательный параметр, задающий замок класса threading.Lock или threading.RLock. По умолчанию создается новый экземпляр замка класса threading.RLock. Методы объекта-условия описаны ниже:
-*acquire(...) Запрашивает замок. Фактически вызывается одноименный метод принадлежащего объекту-условию объекта-замка.
-*release() Снимает замок.
-*wait([timeout]) Переводит поток в режим ожидания. Этот метод может быть вызван только в том случае, если вызывающий его поток получил замок. Метод снимает замок и блокирует поток до появления объявлений, то есть вызовов методов notify() и notifyAll() другими потоками. Необязательный аргумент timeout задает таймаут ожидания в секундах. При выходе из ожидания поток снова запрашивает замок и возвращается из метода wait().
-*notify() Выводит из режима ожидания один из потоков, ожидающих данные условия. Метод можно вызвать, только овладев замком, ассоциированным с условием. Документация предупреждает, что в будущих реализациях модуля из целей оптимизации этот метод будет прерывать ожидание сразу нескольких потоков. Сам по себе метод notify() не приводит к продолжению выполнения ожидавших условия потоков, так как этому препятствует занятый замок. Потоки получают управление только после снятия замка потоком, вызвавшим метод notify().
-*notifyAll() Этот метод аналогичен методу notify(), но прерывает ожидание всех ждущих выполнения условия потоков.
-В следующем примере условия используются для оповещения потоков о прибытии новой порции данных (организуется связь производитель - потребитель, producer - consumer):
- import threading
-            cv = threading.Condition()
-            class Item:
-              """Класс-контейнер для элементов, которые будут потребляться
-              в потоках"""
-              def __init__(self):
-                self._items = []
-              def is_available(self):
-                return len(self._items) > 0
-              def get(self):
-                return self._items.pop()
-              def make(self, i):
-                self._items.append(i)
-            item = Item()
-            def consume():
-              """Потребление очередного элемента (с ожиданием его появления)"""
-              cv.acquire()
-              while not item.is_available():
-                cv.wait()
-              it = item.get()
-              cv.release()
-              return it
-            def consumer():
-              while True:
-                print consume()
-            def produce(i):
-              """Занесение нового элемента в контейнер и оповещение потоков"""
-              cv.acquire()
-              item.make(i)
-              cv.notify()
-              cv.release()
-            p1 = threading.Thread(target=consumer, name="t1")
-            p1.setDaemon(True)
-            p2 = threading.Thread(target=consumer, name="t2")
-            p2.setDaemon(True)
-            p1.start()
-            p2.start()
-            produce("ITEM1")
-            produce("ITEM2")
-            produce("ITEM3")
-            produce("ITEM4")
-            p1.join()
-            p2.join()
-В этом примере условие cv отражает наличие необработанных элементов в контейнере item. Функция produce() "производит" элементы, а consume(), работающая внутри потоков, "потребляет". Стоит отметить, что в приведенном виде программа никогда не закончится, так как имеет бесконечный цикл в потоках, а в главном потоке - ожидание завершения этих потоков. Еще одна особенность - признак демона, установленный с помощью метода setDaemon() объекта-потока до его старта.
-== Очередь ==
-Процесс, показанный в предыдущем примере, имеет значение, достойное отдельного модуля. Такой модуль в стандартной библиотеке языка Python есть, и он называется Queue.
-Помимо исключений - Queue.Full (очередь переполнена) и Queue.Empty (очередь пуста) - модуль определяет класс Queue, заведующий собственно очередью.
-Собственно, здесь можно привести аналог примера выше, но уже с использованием класса Queue.Queue:
- import threading, Queue
-            item = Queue.Queue()
-            def consume():
-              """Потребление очередного элемента (с ожиданием его появления)"""
-              return item.get()
-            def consumer():
-              while True:
-                print consume()
-            def produce(i):
-              """Занесение нового элемента в контейнер и оповещение потоков"""
-              item.put(i)
-            p1 = threading.Thread(target=consumer, name="t1")
-            p1.setDaemon(True)
-            p2 = threading.Thread(target=consumer, name="t2")
-            p2.setDaemon(True)
-            p1.start()
-            p2.start()
-            produce("ITEM1")
-            produce("ITEM2")
-            produce("ITEM3")
-            produce("ITEM4")
-            p1.join()
-            p2.join()
-Следует отметить, что все блокировки спрятаны в реализации очереди, поэтому в коде они явным образом не присутствуют.
-== Модуль thread ==
-По сравнению с модулем threading, модуль thread предоставляет низкоуровневый доступ к потокам. Многие функции модуля threading, который рассматривался до этого, реализованы на базе модуля thread. Здесь стоит сделать некоторые замечания по применению потоков вообще. Документация по Python предупреждает, что использование потоков имеет особенности:
-Исключение KeyboardInterrupt (прерывание от клавиатуры) может быть получено любым из потоков, если в поставке Python нет модуля signal (для обработки сигналов).
-Не все встроенные функции, блокированные ожиданием ввода, позволяют другим потокам работать. Правда, основные функции вроде time.sleep(), select.select(), метод read() файловых объектов не блокируют другие потоки.
-Невозможно прервать метод acquire(), так как исключение KeyboardInterrupt возбуждается только после возврата из этого метода.
-Нежелательно, чтобы главный поток завершался раньше других потоков, так как не будут выполнены необходимые деструкторы и даже части finally в операторах try-finally. Это связано с тем, что почти все операционные системы завершают приложение, у которого завершился главный поток.
-Визуализация работы потоков
-Следующий пример иллюстрирует параллельность выполнения потоков, используя возможности библиотеки графических примитивов Tkinter (она входит в стандартную поставку Python). Несколько потоков наперегонки увеличивают размеры прямоугольника некоторого цвета. Цветом победившего потока окрашивается кнопка Go:
- import threading, time, sys
-            from Tkinter import Tk, Canvas, Button, LEFT, RIGHT, NORMAL, DISABLED
-            global champion
-            # Задается дистанция, цвет полосок и другие параметры
-            distance = 300
-            colors = ["Red","Orange","Yellow","Green","Blue","DarkBlue","Violet"]
-            nrunners = len(colors)      # количество дополнительных потоков
-            positions = [0] * nrunners  # список текущих позиций
-            h, h2 = 20, 10              # параметры высоты полосок
-            def run(n):
-              """Программа бега n-го участника (потока)"""
-              global champion
-              while 1:
-                for i in range(10000):           # интенсивные вычисления
-                  pass
-                graph_lock.acquire()
-                positions[n] += 1                # передвижение на шаг
-                if positions[n] == distance:     # если уже финиш
-                  if champion is None:           # и чемпион еще не определен,
-                    champion = colors[n]         # назначается чемпион
-                  graph_lock.release()
-                  break
-                graph_lock.release()
-            def ready_steady_go():
-              """Инициализация начальных позиций и запуск потоков"""
-              graph_lock.acquire()
-              for i in range(nrunners):
-                positions[i] = 0
-                threading.Thread(target=run, args=[i,]).start()
-              graph_lock.release()
-            def update_positions():
-              """Обновление позиций"""
-              graph_lock.acquire()
-              for n in range(nrunners):
-                c.coords(rects[n], 0, n*h, positions[n], n*h+h2)
-              tk.update_idletasks()  # прорисовка изменений
-              graph_lock.release()
-            def quit():
-              """Выход из программы"""
-              tk.quit()
-              sys.exit(0)
-            # Прорисовка окна, основы для прямоугольников и самих прямоугольников,
-            # кнопок для пуска и выхода
-            tk = Tk()
-            tk.title("Соревнование потоков")
-            c = Canvas(tk, width=distance, height=nrunners*h, bg="White")
-            c.pack()
-            rects = [c.create_rectangle(0, i*h, 0, i*h+h2, fill=colors[i])
-                     for i in range(nrunners)]
-            go_b = Button(text="Go", command=tk.quit)
-            go_b.pack(side=LEFT)
-            quit_b = Button(text="Quit", command=quit)
-            quit_b.pack(side=RIGHT)
-            # Замок, регулирующий доступ к функции пакета Tk
-            graph_lock = threading.Lock()
-            # Цикл проведения соревнований
-            while 1:
-              go_b.config(state=NORMAL), quit_b.config(state=NORMAL)
-              tk.mainloop()             # Ожидание нажатия клавиш
-              champion = None
-              ready_steady_go()
-              go_b.config(state=DISABLED), quit_b.config(state=DISABLED)
-              # Главный поток ждет финиша всех участников
-              while sum(positions) < distance*nrunners:
-                update_positions()
-              update_positions()
-              go_b.config(bg=champion)     # Кнопка окрашивается в цвет победителя
-              tk.update_idletasks()
-Примечание:
-Эта программа использует некоторые возможности языка Python 2.3 (встроенную функцию sum() и списковые включения), поэтому для ее выполнения нужен Python версии не меньше 2.3.
-== Заключение ==
-Навыки параллельного программирования необходимы любому профессиональному программисту. Одним из вариантов организации (псевдо) параллельного программирования является многопоточное программирование (другой вариант, более свойственный Unix-системам - многопроцессное программирование - здесь не рассматривается). В обычной (однопоточной) программе действует всего один поток управления, а в многопоточной одновременно могут работать несколько потоков.
-Параллельное программирование требует тщательной отработки взаимодействия между потоками управления. Некоторые участки кода необходимо ограждать от одновременного использования двумя различными потоками, дабы не нарушить целостность изменяемых структур данных или логику работы с внешними ресурсами. Для ограждения участков кода используются замки и семафоры.
-Стандартная библиотека Python предоставляет довольно неплохой набор возможностей для многопоточного программирования в модулях threading и thread, а также некоторые полезные вспомогательные модули (например, Queue ).

Аноним

Поиск

«Cоздание нескольких потоков и управление ими в Python» и «Recover Deleted Files on an NTFS Hard Drive from a Linux»: разница между страницами

Версия от 23:39, 25 сентября 2017

Навигация

Вики-инструменты

Инструменты для страниц