Перейти к содержанию

Как автоматически посчитать число страниц в разных файлах?


Рекомендуемые сообщения

Опубликовано

Всем привет!

 

Есть техническая проблема, прошу помощи в автоматизации.

 

Ситуация: мне принесли жесткий диск с разрозненными файлами. Там могут быть договоры и прочие документы в формате doc, docx, xls, xlsx и подобные (пока сам не знаю точно какие, еще не видел диск). Некоторые документы могут быть по одной странице, некоторые по 1000 страниц. Допустим, на диске будет 5123 документа (наугад написал, скорее всего будет больше).

 

Мне нужно узнать объём выполняемой работы в страницах. Каждый понимает, что оплатить труд по анализу 50 страниц дешевле, чем по анализу 5000 страниц. Кроме того, чем больше страниц, тем больше время требуется на работу.

Стандартный вариант: открыть вордом или экселем документ, нажать кнопку "печать" и в предпросмотре увидеть количество страниц в данном документе при выводе на печать. И сделать это 5123 раза подряд, суммируя результаты. Это труд, который может занять море времени.

 

Как посчитать автоматически количество страниц во всех документах при выводе их на печать, не открывая каждый из них отдельно?

Опубликовано (изменено)
19 минут назад, kmscom сказал:

Так всё равно надо будет сидеть и потом на калькуляторе плюсовать страницы, так что под условия задачи не подходит.

19 минут назад, kmscom сказал:

Поиск подсказал один из способов

В поиске можно найти это https://www.sql.ru/forum/953973/kak-poschitat-obshhee-kolichestvo-stranic-teksta-v-nabore-faylov-word-a

Вроде как раз то что нужно, но там делалось для старого ворда. Так что если для .doс и будет работать (не проверял), то для docx и так ясно, что работать не будет. Ибо это уже по структуре это документ внутри архива. На всякий случай код .vbs скрипта из последнего вложения там

With CreateObject("word.application")
  For Each x In CreateObject("scripting.filesystemobject").getfile(wscript.scriptfullname).parentfolder.Files
    If LCase(Mid(x.Name, InStrRev(x.Name, ".") + 1, 3)) = "doc" Then
      With .documents.open(x.Path, , True) 'ReadOnly
        numDocs = numDocs + 1
        sumPages = sumPages + .Content.ComputeStatistics(2) 'wdStatisticPages
'        sumPages = sumPages + .BuiltInDocumentProperties(14) 'wdPropertyPages 'считает неправильно!
        .Close False 'don't save changes
      End With
    End If
  Next
  .Quit
End With
wscript.echo "Всего страниц " & sumPages & Chr(13) & "Документов " & numDocs

 

Изменено пользователем regist
  • Like (+1) 1
  • Спасибо (+1) 1
Опубликовано
1 час назад, regist сказал:

Так всё равно надо будет сидеть и потом на калькуляторе плюсовать страницы, так что под условия задачи не подходит.

Зачем? Там ведь отобразиться количество страниц сразу нескольких документов.

Опубликовано
3 часа назад, kmscom сказал:

Поиск подсказал один из способов

Там есть один момент: "Замечание: Если в списке присутствуют файлы, в которых нет подсчёта страниц, то в столбце Число страниц (Pages) указано ничего не будет."

 

2 часа назад, regist сказал:

Так всё равно надо будет сидеть и потом на калькуляторе плюсовать страницы, так что под условия задачи не подходит.

3 часа назад, kmscom сказал:

Их хотя бы не надо открывать каждый, уже хорошо.

Опубликовано (изменено)

Не вижу, где там показывает сразу у нескольких документов.

 

Попробовал способ через колонку "Число страниц" на MS Office 2019, Windows 10 x64,

система корректно показывает кол-во страниц только у документов, созданных этим же Office 2019 (как doc, так и docx),

у других doc, например, созданных в Office 2003, показывает всегда число 1.

А еще часто бывают rtf, там вообще не отображается.

 

Попробовал способ через vbs, считает долго (т.к. открывает в скрытом виде каждый документ), но посчитало правильно.

Для docx тебе ничего исправлять в скрипте не надо, т.к. во первых проверяются только первые 3 буквы после последней точки в имени файла,

во-вторых, документ открывается точно также как и doc, не смотря на другую его структуру, ведь скрипт берёт значение от самого Word-а,

не анализируя внутренности файла самостоятельно.

 

Сделал обобщённый вариант vbs, с подсчетом раздельно и в сумме DOC*, XLS*, RTF со сканом рекурсивно (с подкаталогами):

 

Dim numXDocs, sumXSheets, sumXPages, numWDocs, sumWPages

set oExcel = CreateObject("excel.application")
set oWord = CreateObject("word.application")
set root = CreateObject("scripting.filesystemobject").getfile(wscript.scriptfullname).parentfolder
Analysis(root)

oExcel.Quit: oWord.Quit
set oExcel = Nothing: set oWord = Nothing: set root = Nothing

wscript.echo _
	"DOC*, RTF:" & Chr(13) & _
	"Всего страниц: " & sumWPages & Chr(13) & "Документов: " & numWDocs & _
	Chr(13) & Chr(13) & "XLS*" & Chr(13) & _
	"Всего страниц: " & sumXPages & Chr(13) & "Всего листов: " & sumXSheets & Chr(13) & "Документов: " & numXDocs & _
	Chr(13) & Chr(13) & "-----------------" & Chr(13) & "Общее:" & Chr(13) & Chr(13) & _
	"Страниц: " & sumXPages + sumWPages & Chr(13) & "Документов: " & numXDocs + numWDocs
	
Sub Analysis(root)

	With oExcel
	  For Each x In root.Files
		If LCase(Mid(x.Name, InStrRev(x.Name, ".") + 1, 3)) = "xls" Then
		  With .workbooks.open(x.Path, , True) 'ReadOnly
			numXDocs = numXDocs + 1
			sumXSheets = sumXSheets + .sheets.count
			For Each sheet in .sheets
			  sumXPages = sumXPages + (sheet.HPageBreaks.Count + 1) * (sheet.VPageBreaks.Count + 1)
			Next
			.Close False 'don't save changes
		  End With
		End If
	  Next
	  .Quit
	End With
	
	With oWord
	  For Each x In root.Files
	    ext = LCase(Mid(x.Name, InStrRev(x.Name, ".") + 1, 3))
		if ext = "doc" or ext = "rtf" then
          With .documents.open(x.Path, , True) 'ReadOnly
            numWDocs = numWDocs + 1
            sumWPages = sumWPages + .Content.ComputeStatistics(2) 'wdStatisticPages
            .Close False 'don't save changes
          End With
		end if
	  Next
    End With

	For Each x in root.SubFolders: Analysis(x): Next

End Sub

 

Изменено пользователем Dragokas
  • Like (+1) 2
  • Спасибо (+1) 1
Опубликовано
1 час назад, Dragokas сказал:

Сделал обобщённый вариант vbs, с подсчетом раздельно и в сумме DOC*, XLS*, RTF со сканом рекурсивно (с подкаталогами):

 

Спасибо! А как его запускать? В блокнот скопировать и сменить расширение на *.vbs? 

Опубликовано
6 часов назад, Воронцов сказал:

Зачем? Там ведь отобразиться количество страниц сразу нескольких документов.

Нескольких, но число то выводится для каждого отдельно, а не суммарное в папке.

 

2 часа назад, Mrak сказал:

В блокнот скопировать и сменить расширение на *.vbs? 

да.

  • Спасибо (+1) 1
Опубликовано

В блокноте - Сохранить как - тип файла "Все файлы" и сменить расширение на .vbs

Закинуть в нужную папку и запустить.

  • Спасибо (+1) 1
  • 1 год спустя...
Опубликовано
03.12.2020 в 19:59, Dragokas сказал:

Не вижу, где там показывает сразу у нескольких документов.

 

Попробовал способ через колонку "Число страниц" на MS Office 2019, Windows 10 x64,

система корректно показывает кол-во страниц только у документов, созданных этим же Office 2019 (как doc, так и docx),

у других doc, например, созданных в Office 2003, показывает всегда число 1.

А еще часто бывают rtf, там вообще не отображается.

 

Попробовал способ через vbs, считает долго (т.к. открывает в скрытом виде каждый документ), но посчитало правильно.

Для docx тебе ничего исправлять в скрипте не надо, т.к. во первых проверяются только первые 3 буквы после последней точки в имени файла,

во-вторых, документ открывается точно также как и doc, не смотря на другую его структуру, ведь скрипт берёт значение от самого Word-а,

не анализируя внутренности файла самостоятельно.

 

Сделал обобщённый вариант vbs, с подсчетом раздельно и в сумме DOC*, XLS*, RTF со сканом рекурсивно (с подкаталогами):

 


Dim numXDocs, sumXSheets, sumXPages, numWDocs, sumWPages

set oExcel = CreateObject("excel.application")
set oWord = CreateObject("word.application")
set root = CreateObject("scripting.filesystemobject").getfile(wscript.scriptfullname).parentfolder
Analysis(root)

oExcel.Quit: oWord.Quit
set oExcel = Nothing: set oWord = Nothing: set root = Nothing

wscript.echo _
	"DOC*, RTF:" & Chr(13) & _
	"Всего страниц: " & sumWPages & Chr(13) & "Документов: " & numWDocs & _
	Chr(13) & Chr(13) & "XLS*" & Chr(13) & _
	"Всего страниц: " & sumXPages & Chr(13) & "Всего листов: " & sumXSheets & Chr(13) & "Документов: " & numXDocs & _
	Chr(13) & Chr(13) & "-----------------" & Chr(13) & "Общее:" & Chr(13) & Chr(13) & _
	"Страниц: " & sumXPages + sumWPages & Chr(13) & "Документов: " & numXDocs + numWDocs
	
Sub Analysis(root)

	With oExcel
	  For Each x In root.Files
		If LCase(Mid(x.Name, InStrRev(x.Name, ".") + 1, 3)) = "xls" Then
		  With .workbooks.open(x.Path, , True) 'ReadOnly
			numXDocs = numXDocs + 1
			sumXSheets = sumXSheets + .sheets.count
			For Each sheet in .sheets
			  sumXPages = sumXPages + (sheet.HPageBreaks.Count + 1) * (sheet.VPageBreaks.Count + 1)
			Next
			.Close False 'don't save changes
		  End With
		End If
	  Next
	  .Quit
	End With
	
	With oWord
	  For Each x In root.Files
	    ext = LCase(Mid(x.Name, InStrRev(x.Name, ".") + 1, 3))
		if ext = "doc" or ext = "rtf" then
          With .documents.open(x.Path, , True) 'ReadOnly
            numWDocs = numWDocs + 1
            sumWPages = sumWPages + .Content.ComputeStatistics(2) 'wdStatisticPages
            .Close False 'don't save changes
          End With
		end if
	  Next
    End With

	For Each x in root.SubFolders: Analysis(x): Next

End Sub

 

Drakokas, спасибо тебе большущее! Твой скрипт меня очень выручил. Случайно наткнулся на этот форум, когда гуглил способ подсчёта страниц огромного пакета документов. В моём случае вышло 113238 страниц. Как бы я считал это вручную - хз.

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти
  • Похожий контент

    • InternalPower
      Автор InternalPower
      День добрый. Столкнулся с проблемой, комп начал шуметь сильнее, греться, и частое выкидывание из игр. Вирус не дает запускать в браузере сайты с упоминанием слова «вирус» и ему подобным, сразу выключает браузер. Диспетчер задач тоже отключается. Антивирусы установить не дает. Проверяю в течение последних нескольки часов , единственное, что дает запустить. Обнаружил - удалил - перезагрузил - они опять появились. Запустить программы фарбар, автологгер тоже не дает запустить (читал в подобных темах)



    • SOL.
      Автор SOL.
      пицот

    • MiStr
      Автор MiStr
      Последние несколько дней захожу на форум и всё жду: когда же мы превысим порог в 50 000 сообщений? Судя по активности, это должно произойти скоро. Заснимите скриншот, если кто будет на форуме в момент икс.
       
      На момент написания сообщения всего на форуме около 49 900 сообщений.
    • E.K.
      Автор E.K.
      Всем привет!
       
      Вот так обычно и происходит - наконец-то закончился предыдущий год, а за ним уже спешит крутить дни-недели год с очередным номером. А мы не то отдохнули, не то просто просто отдышались от непредсказуемостей года-2022, который будем помнить очень хорошо, за это я уверен - "нам выпала великая честь жить в перемену времён" (с), - и уже с головой окунулись в новый 2023й год.
       
      Можно даже сказать, что мы неизбежно прыгнули в ещё один год из категории "ревущие двадцатые" (есть такой термин, но он про другое). Сначала злобный вирус, пандемия и карантины разные, а потом… вы и сами всё знаете. Жить и трудиться теперь приходится в реалиях концентрированного "густопсового" геополитизма, что означает, что мы всё больше и дальше "выходим из зоны комфорта", преодолеваем как ожидаемые последствия глобальных перемен, так и авралимся на совершенно непредвиденные события. Короче, живём и строим безопасный цифровой мир в условиях глобального геополитического шторма.
       
      Что приятно (хоть официальные и проверенные данные будут позже), наша компания выстояла и показала совершенно фантастический в нынешних условиях результат - продажи наших продуктов практически не упали! Ещё раз. Финансовые результаты мы публикуем после независимого аудита, но предварительно /* и по большому секрету */ могу сказать - у нас всё ровно! Очевидное падение в Северной Америке и Европе было компенсировано ростом во всех остальных регионах и странах, особенно в России.
       
      Как мы так увернулись? - да мы просто ой-какие-молодцы! Это во-первых. А во-вторых, мы уже не первый год живём в условиях аврала. И кризис-менеджмент, к сожалению, становится привычным методом управления компанией.. Да, хотелось бы жить в "ровных" условиях, в комфорте, без всякой геополитической хрени... Но, увы, это от нас не зависит. Посему, приходится адаптироваться, выкручиваться, биться за результат. А как иначе?
       
      И это не впервые. Сначала нас потрепало в конце 2014 и в 2015 году, когда в декабре 2014-го были санкции, обвал рубля и прочая "развлекуха". А тогда ~20% наших доходов была как раз рублёвая (сейчас, само собой, уже больше). И обрушение рубля в краткосрочном моменте было серьёзным ударом по финансовым результатам компании. Хорошо, что тогда все остальные просели ещё больше, а нам удалось выплыть на этой волне. Но было весьма неприятно.
       
      Далее - осень 2017. То, что мы сейчас у себя внутри компании называем "шит-шторм" - "шторм говна". Та осень, когда практически каждый день, а то и пару раз в день ведущая американская пресса писала про нас разные мерзкие гадости. Читать об этих событиях и нашей реакции здесь. // Если помните - меня грозились вызвать на слушания в Сенат, я собрался ехать - и всё отменили 🙂
       
      Ну, про ковидный 2020 уже рассказал. А далее не менее "интересный" 2022й - со всеми вытекающими из этого следствиями..
       
      Короче, начало 2023 пока совершенно не разнообразно по теме путешествий. Сижу на "ровном заду", поскольку никаких конференций-мероприятий, требующих моего участия "нет-как-нет". В целом, это не первый раз такое. Обычно в январе у меня был Давос и разное по-мелочи в Европах. Про Давос и моё "нет" уже рассказывал - этот экономический форум, увы, превратился в геополитический шабаш. А в Европе после начала активной фазы конфликта на Украине - мне там сейчас делать совершенно нечего. Посему сижу пока в Москве, наблюдаю за работой компании, на фанклуб тексты сочиняю 🙂
       
      [ продолжение следует ]
    • infobez_bez
      Автор infobez_bez
      Здравствуйте
      интересует такой вопрос:
      Например есть группа администрирования "Карантин" - в ней 0 устройств, управляется политикой, которая ограничивает доступ в сеть, блокирована USB шина и т.д.
      Есть группа администрирования " Не карантин" - в ней например 100 устройств, там своя политика.
       
      В KSC, во вкладке "Устройства/Правила перемещения" - есть возможность настройки автоматического перемещения устройств между группами/ распределенными и нераспределенными устройствами. Для настройки перемещения есть условия сработки правила перемещения (теги, сеть, программы и т.д.).

      Плюс есть вкладка Устройства/Выборки устройств - где собраны различные выборки, с защитой/без защиты, устаревшие базы, есть активные угрозы и т.д.
       
      Хотелось бы выполнить настройку таким образом, чтобы при наличии на устройстве активных угроз оно автоматически перемещалось в группу администрирования "Карантин".

      В правилах перемещения - условия похожего на "наличие активных угроз" - нет, перемещать по попаданию в выборку тоже нельзя, но появилась мысль зацепиться за теги, например, есть активная угроза -> назначается тег -> по тегу устройство автоматически перемещается в группу администрирования "карантин" и на него действует соответствующая политика. Но в тегах тоже ничего подходящего не смог найти.
       
      Подскажите, можно ли выполнить настройку автоматического перемещения устройства между группами администрирования (или между политиками)  по наличию на устройстве активных угроз или нахождения вирусной активности? 
      Используется KSC 14.2 для Windows
×
×
  • Создать...