Perfiles sintéticos de uso de energía residencial de alta resolución para los Estados Unidos

Blog

HogarHogar / Blog / Perfiles sintéticos de uso de energía residencial de alta resolución para los Estados Unidos

Nov 17, 2023

Perfiles sintéticos de uso de energía residencial de alta resolución para los Estados Unidos

Datos científicos volumen 10, Número de artículo: 76 (2023) Citar este artículo 3059 Accesos 4 Citas 4 Detalles de Altmetric Metrics El consumo eficiente de energía es crucial para lograr una energía sostenible

Datos científicos volumen 10, número de artículo: 76 (2023) Citar este artículo

3059 Accesos

4 citas

4 altmétrico

Detalles de métricas

El consumo eficiente de energía es crucial para lograr objetivos energéticos sostenibles en la era del cambio climático y la modernización de la red. Por lo tanto, es vital comprender cómo se consume la energía en resoluciones más finas, como en el hogar, para planificar eventos de respuesta a la demanda o analizar los impactos del clima, los precios de la electricidad, los vehículos eléctricos, la energía solar y los horarios de ocupación en el consumo de energía. Sin embargo, la disponibilidad y el acceso a datos detallados sobre el uso de energía, que permitirían realizar estudios detallados, han sido escasos. En este documento, publicamos un gemelo digital único, a gran escala, de un conjunto de datos sobre el uso de energía residencial para el sector residencial en los Estados Unidos contiguos, que cubre millones de hogares. Los datos comprenden perfiles de uso de energía por hora para hogares sintéticos, desglosados ​​en cargas controladas termostáticamente (TCL) y uso de electrodomésticos. El marco subyacente se construye utilizando un enfoque ascendente. Se utilizan diversas encuestas de código abierto y modelos de primeros principios para el modelado de uso final. Se ha realizado una validación exhaustiva del conjunto de datos sintéticos mediante comparaciones con los datos informados sobre el uso de energía. Presentamos un conjunto de datos detallado, abierto y de alta resolución sobre el uso de energía residencial para los Estados Unidos.

La modernización de la red eléctrica estadounidense se está produciendo a un ritmo notable debido a la instalación de nuevas tecnologías dentro de la red, como los contadores inteligentes. Permiten la comunicación bidireccional entre el cliente y las empresas de servicios públicos, proporcionando información y control granular del uso de energía para hogares individuales1,2. La red también está experimentando rápidas transformaciones debido a la creciente penetración de los vehículos eléctricos (EV) y los recursos energéticos distribuidos (DER), como la energía fotovoltaica (PV) en los tejados, la energía solar comunitaria y la eólica. Si bien esta ola de modernización es beneficiosa, la red eléctrica se enfrenta simultáneamente a un fuerte aumento de situaciones de crisis como resultado de fenómenos del cambio climático3,4 como eventos climáticos extremos y el calentamiento global. Un ejemplo de clima extremo es la ola de frío norteamericana de febrero de 2021, que provocó una enorme tensión en la red eléctrica, especialmente en Texas, donde millones de personas se quedaron sin electricidad durante días5. Otro ejemplo es el impacto del calentamiento global en el uso de energía HVAC en los hogares. Aunque se espera que el aumento de 1° a 2°C en las temperaturas invernales reduzca las necesidades de calefacción, se espera que un aumento similar en las temperaturas estivales aumente significativamente las necesidades de refrigeración6.

Frente a estos desafíos, lograr objetivos energéticos sostenibles se ha vuelto primordial para mantener una red saludable. Con este fin, la comunidad investigadora se enfrenta a importantes cuestiones relativas a la reducción de la huella de carbono7,8,9,10,11, la incentivación de la adopción de DER12, el estudio de los beneficios de la modernización energética de los edificios9,13,14, la integración de los vehículos eléctricos15 y el comportamiento del consumidor16 en el red eléctrica y mecanismos para diseñar los precios de la electricidad17,18 para crear patrones de consumo residencial eficientes. Responder a muchas de estas preguntas requiere un conocimiento exhaustivo de los patrones de uso de energía, el parque inmobiliario, la estructura de las redes de distribución, el comportamiento de los consumidores, etc. Sin embargo, estos conjuntos de datos exhaustivos rara vez están disponibles gratuitamente (o no están disponibles en absoluto) para uso en investigación, lo que dificulta que la comunidad investigadora lleve a cabo estos esfuerzos19. Las razones de la falta de disponibilidad de dichos datos van desde preocupaciones por la privacidad hasta la falta de un sistema para poner los datos a disposición de los investigadores.

La mayoría de los datos publicados sobre el uso de energía son datos medidos, resultado de estudios longitudinales realizados por investigadores (Tabla 1) con muestras relativamente pequeñas de hogares que pueden no ser representativas de la región geográfica y la demografía más amplia. Algunos de estos estudios monitorean los hogares durante un período de tiempo más largo (por ejemplo, dos años); sin embargo, la desventaja de tales experimentos es que requieren una cantidad considerable de tiempo (por ejemplo, consentimiento de los participantes, configuración del equipo, monitoreo) y esfuerzo manual (por ejemplo, limpieza de datos, imputación de valores faltantes) antes de que dichos datos sean utilizables. Aunque estos estudios publican datos sobre energía para uso gratuito, muchos de ellos limitan la publicación de detalles de los participantes (por ejemplo, características y ubicación del edificio, datos demográficos a nivel de hogar). Los detalles de los participantes generalmente se retienen debido a razones de privacidad/consentimiento del participante, falta de información o falta de disponibilidad de estos atributos en la versión gratuita de los datos. La literatura ha intentado abordar algunas de estas cuestiones mediante la creación de estructuras de datos apropiadas para publicar información de metadatos de electrodomésticos para los hogares junto con sus datos de uso de energía20,21. Sin embargo, observamos que muchos de los problemas aún persisten en el contexto estadounidense. Un ejemplo de ello es el Pecan Street Dataport22. Pecan Street Inc23. es el mayor editor de datos sobre el uso de energía en los EE. UU. a través de su portal: Dataport. Recopilan datos sobre el uso de energía en California (CA), Texas (TX), Nueva York (NY) y Colorado (CO). Este es un conjunto de datos potencialmente muy útil. Sin embargo, solo una pequeña muestra (~25 hogares en CA y TX) de datos sobre el uso de energía está disponible gratuitamente para uso público y no contiene suficiente (o ninguna) información demográfica o de construcción.

Un conjunto de datos sintetizado en un ámbito espacial más amplio ofrece la oportunidad de estudiar diferencias regionales y temporales en el uso de energía, mientras que un conjunto de datos de una región más pequeña ofrece estudiar patrones de uso de energía que pueden ser específicos de la región. Independientemente del alcance espacial, el tamaño pequeño de la muestra dificulta obtener una buena representación de la variación de la población en la región (por ejemplo, explicar/explotar el papel de la demografía de los hogares, el comportamiento y las características de los edificios en el uso de energía). Además del alcance espacial y la cantidad de muestras, muchos de los conjuntos de datos no publican suficientes (o ninguno) detalles de los participantes. Estos datos limitados restringen el uso de estos datos sobre el uso de energía para análisis prácticos detallados o para estudiar intervenciones de escenarios y cuestiones de equidad en la red (por ejemplo, qué tipo de parque demográfico y de edificios es el más adecuado para la adopción de vehículos eléctricos, o cuánta huella de carbono se puede reducir). reducirse mediante la modernización de los edificios). Por lo tanto, observamos que existe una escasez general de conjuntos de datos de uso de energía de alta resolución a gran escala junto con información detallada de metadatos a nivel del hogar, como propiedad de electrodomésticos, datos de construcción y características demográficas importantes.

Resumimos las desventajas clave de los conjuntos de datos energéticos para los EE. UU. de la siguiente manera: alcance espacial limitado, tamaño de muestra pequeño, falta de metadatos suficientes sobre hogares, electrodomésticos y edificios. Dada esta amplia gama de problemas con la disponibilidad de datos de uso de energía de última generación, presentamos conjuntos de datos sintéticos sobre el uso de energía que pueden abordar muchos de estos problemas. Los datos sintéticos se definen como datos generados por modelos que proporcionan representaciones estadísticas precisas del mundo real. Ejemplos de estos datos para la red inteligente son las redes sintéticas de distribución de energía24, los perfiles de consumo de energía para oficinas y edificios comerciales25 y para edificios residenciales26,27,28,29. Nuestro trabajo aborda específicamente la brecha de escasez de datos en la investigación del uso de energía para el sector residencial de EE. UU. Proponemos un marco sintético para modelar datos de uso de energía de alta resolución a gran escala mediante la integración de diversos conjuntos de datos y modelos de uso final para el modelado de energía desagregado de abajo hacia arriba. Esto da como resultado un nuevo conjunto de datos sintéticos sobre el uso de energía (es decir, un gemelo digital de la demanda de energía a nivel de los hogares) que comprende perfiles de demanda de energía eléctrica por hora para los hogares estadounidenses. El uso total de energía eléctrica se publica como una composición de ocho usos finales principales en un hogar: calefacción/aire acondicionado (HVAC), iluminación, lavado de platos, cocina, lavandería (lavadora y secadora de ropa), refrigeración, agua caliente y carga de enchufe varios (aspiradora, uso de computadora, TV). Se desarrolla un marco ascendente detallado con uso intensivo de datos para generar perfiles sintéticos de uso de energía mediante la integración de múltiples encuestas de código abierto y una población sintética para los EE.UU.30. Se utiliza una combinación de métodos (estocástico, aprendizaje automático, métodos de ingeniería basados ​​en la física) para modelar diferentes usos finales en todos los hogares que consumen electricidad como combustible principal en los 48 estados contiguos y Washington, DC en América del Norte. Hasta donde sabemos, este conjunto de datos sintéticos sobre el uso de energía es el primer conjunto de datos detallado, a gran escala y de libre acceso sobre comportamientos de consumo de electricidad a nivel doméstico en los EE. UU. Nuestra infraestructura sintética sobre el uso de energía es adecuada para resolver la nueva red inteligente. problemas mencionados anteriormente. Publicamos las series temporales de uso de energía desagregadas para todos los hogares sintéticos. Los datos publicados son representativos de los hogares de EE. UU., proporcionan metadatos a nivel de hogares y son una buena representación del uso de energía en el mundo real. La figura 1 proporciona una ilustración gráfica del gemelo digital sintetizado de la demanda de energía residencial.

Esta sección describe los conjuntos de datos y modelos empleados para generar series temporales de uso de energía sintética a nivel de hogar; consulte la Tabla 2. Todas las notaciones utilizadas en el documento se describen en la Tabla 3.

El marco presentado se compone de una representación sintética de la población estadounidense, modelos de regresión para encuestas y modelos de uso de energía ascendentes. Una población sintética está compuesta por hogares y personas en hogares. Los hogares sintéticos se generan mediante encuestas censales y métodos estadísticos de modo que la población sintética sea estadísticamente similar a la población original. En nuestro marco se utiliza una versión de código abierto de la población sintética de EE. UU.: Poblaciones y ecosistemas sintéticos del mundo (SPEW)30,31. La población sintética SPEW se compone de características demográficas de hogares sintéticos e individuos sintéticos. La población sintética se crea utilizando datos del censo estadounidense como PUMS (Tabla 2) y métodos estadísticos como el muestreo y el método de ajuste proporcional iterativo (IPF)32.

Los hogares SPEW se componen de información demográfica básica (por ejemplo, ingresos, edad) y de localidad. Aunque la población SPEW es representativa de la población de EE. UU. en una resolución espacial más fina, no está equipada con la información relacionada con la energía y la actividad (por ejemplo, características del edificio, tiempo que se pasa en casa, número de actividades de cocina) necesaria para estimar el uso de energía a nivel doméstico. o nivel de persona. La información relacionada con el parque de edificios, la energía y la actividad se recopila mediante encuestas nacionales en los EE. UU.: Encuesta de consumo de energía residencial RECS33 y Encuesta estadounidense de uso del tiempo ATUS34, respectivamente. La población sintética básica se aumenta con atributos relacionados con la energía y la actividad mediante la construcción de modelos de aprendizaje automático. Este aumento se denomina paso de enriquecimiento. La población sintética enriquecida junto con otras fuentes de datos disponibles gratuitamente se pueden utilizar juntas como insumos para el marco de modelación del uso de energía. El marco de modelado de uso de energía tiene seis modelos para representar nueve usos de energía: HVAC, iluminación, agua caliente sanitaria, refrigerador, lavavajillas, cocina, lavadora, secadora y enchufes diversos, como TV, uso de computadoras, actividades de limpieza (por ejemplo, , Pasar la aspiradora). La primera subsección describe los detalles del modelado del paso de enriquecimiento y la siguiente subsección describe los modelos de demanda de energía.

Resumen de datos. Esta figura muestra ejemplos de las resoluciones espacio-temporales de múltiples facetas de los datos de demanda de energía sintética desagregados. La figura muestra datos de muestra a nivel estatal, de condado y de hogar en diferentes granularidades temporales. Los datos se generan para todos los hogares en los EE. UU.

Los modelos de enriquecimiento apoyan la creación de estructuras sintéticas integrales para calcular el uso de energía residencial. Este paso se denomina paso de enriquecimiento. Consulte la Fig. 2 para obtener una representación gráfica de la descripción general del marco. Los conjuntos de datos utilizados en este flujo de trabajo se describen en la Tabla 2. Dado que las características demográficas disponibles en la población sintética no son suficientes para calcular el uso de energía, se enriquece agregando capas de información relacionada con el parque de edificios y el consumo de energía de la encuesta RECS, como características del edificio, propiedad de electrodomésticos y comportamientos de los puntos de ajuste del termostato. Este mapeo de características se realiza mediante la construcción de modelos de árboles de inferencia. Los cronogramas de actividades para un día normativo de un encuestado ATUS se adjuntan al individuo sintético mediante la construcción de un modelo de regresión forestal aleatorio multivariado. Estos modelos se describen a continuación.

Descripción general de la infraestructura de modelado energético. En el marco de modelado propuesto se utilizan muchos tipos diferentes de datos de entrada. Estos se muestran en la parte superior. Para obtener una descripción completa de los conjuntos de datos de entrada, consulte la Tabla 2. Estos conjuntos de datos se ingresan en diferentes componentes de modelado del marco. Algunos conjuntos de datos respaldan el aumento de la población sintética, mientras que otros se incorporan a los modelos de uso de energía. Todos los modelos se describen en el apartado Metodología. El rectángulo inferior describe los datos registrados/datos de medidores inteligentes de diferentes zonas climáticas de los EE. UU. Estos conjuntos de datos se utilizan para la validación de las series temporales sintéticas de uso de energía. El bloque de validación (fondo amarillo) describe tres componentes de V&V: comparaciones regionales, de magnitud y estructurales/de forma. Esta línea de validación cubre (a) diferentes aspectos temporales (horarios y diarios), (b) aspectos espaciales en términos de regiones y estaciones, (c) aspectos de diversidad de los datos sintéticos a gran escala. El texto azul hace referencia a las V del big data. Cada bloque coloreado posee la característica V dada.

Los datos de ATUS proporcionan encuestas representativas a nivel nacional de las actividades de las personas en diferentes tipos de lugares, como el cuidado de los niños dentro o fuera de la casa, el tiempo dedicado al trabajo, el tiempo de lavandería en el hogar, los tiempos de espera en el hospital, etc.; consulte la Tabla 2 para obtener una descripción. Los diarios de uso del tiempo de los individuos encuestados se pueden adjuntar a individuos sintéticos haciendo coincidir un individuo encuestado apropiado con un individuo sintético. En nuestro trabajo, consideramos una coincidencia adecuada en función de la cantidad de tiempo que una persona pasa en diferentes tipos de ubicaciones, como el hogar, el trabajo, la escuela, las compras y otras ubicaciones diversas. Este parece un enfoque razonable porque estamos interesados ​​en saber cómo pasa un individuo las 24 horas del día categorizando la cantidad de tiempo que pasa en tipos de ubicaciones importantes; por ejemplo, el tiempo que pasa en diferentes tipos de ubicaciones para una persona que trabaja a tiempo completo es bastante diferente a una persona mayor confinada en casa o a un estudiante universitario. Esta justificación para asignar a los encuestados a individuos sintéticos también se presentó en trabajos anteriores de Lum et al.35.

El método de regresión de bosque aleatorio se utiliza para construir un modelo que predice la cantidad de tiempo que una persona pasa en lugares como el hogar, el trabajo, las compras, otros, la escuela y el conteo de viajes durante el día. Por lo tanto, se modelan seis variables dependientes: recuento de viajes durante el día y tiempo pasado en cada tipo de ubicación: hogar, trabajo, compras, otros, escuela. Las variables independientes utilizadas para construir el modelo son las siguientes: número de miembros en el hogar (hsize), número de hijos (nchild), edad (age), horas de trabajo (wrkhrs), género (gender), ingresos modelados como una variable categórica. (hinc2, hinc3), y variables binarias como ciudadano estadounidense o no (natividad), trabajador o no (trabajador), propietario de una casa o no (propio hogar), tiene teléfono o no (tel) y variables relacionadas con la raza, como si la persona es blanca, hispana, negra o asiática (blanca, hispana, negra, asiática). La Figura 3 muestra un ejemplo de característica importante para dos variables dependientes.

Importancia y correlación de características basadas en impurezas. Cada gráfico muestra la importancia de Gini de las características de dos variables dependientes: hogar y trabajo. El eje x muestra las variables independientes en orden de importancia según IncNodePurity. La selección de los parámetros para 'ntree' (número de árboles de decisión) y 'node size' (tamaño mínimo de nodos terminales). Se prueban ocho condiciones para la combinación de los dos parámetros: ntree = 500, 1000, 1500 y 2000; tamaño de nodo = 5 y 10. Los gráficos muestran resultados sólidos en las diferentes condiciones. Según los gráficos, las siguientes cinco variables independientes: wrkhrs; obrero; edad; hinc3; hsize afecta principalmente a todas las variables dependientes. El eje y derecho muestra el coeficiente de correlación absoluto de Pearson. Los coeficientes positivos y negativos se distinguen por puntos y cuadrados azules, respectivamente. Excepto trabajadores; trabajador, todas las demás variables independientes estaban débilmente correlacionadas con las variables dependientes.

Una vez que el modelo se entrena con los encuestados ATUS, a una persona sintética Pi, j se le asigna aleatoriamente un individuo de la encuesta de los nodos de hoja en el modelo de conjunto entrenado. Así, el resultado proporciona a cada individuo sintético un diario de uso del tiempo. Los modelos de uso de energía extraerán las actividades del hogar de un diario de tiempo y también construirán un cronograma de ocupación a nivel del hogar durante las 24 horas, denotado como \(\langle {O}_{i,0},{O}_ {i,1},\ldots ,{O}_{i,23}\rangle \). Estos se utilizan como insumo para los modelos de uso de energía. Los conflictos sintéticos de programación de actividades de los miembros del hogar se manejan en el modelo de actividad.

La población sintética de referencia no tiene ninguna característica estructural del edificio ni información sobre la propiedad de los electrodomésticos. Estas características destacadas son importantes para modelar diferentes categorías de uso de energía y están disponibles en la encuesta RECS. Superponemos los atributos del hogar RECS en un hogar sintético mediante la construcción de árboles de inferencia condicional multivariados36,37. El árbol de inferencia condicional es una clase no paramétrica de árboles de regresión que utiliza la partición recursiva de variables dependientes en función del valor de las correlaciones. Se modelan cuatro variables dependientes: pies cuadrados de la vivienda, presencia de electrodomésticos de lavandería, presencia de aire acondicionado, presencia de lavavajillas. Las variables independientes son año en que se construyó la casa, tiempo de ocupación de los inquilinos actuales, propiedad o alquiler de la residencia, número total de habitaciones, ingresos, número de refrigeradores, número de miembros del hogar, tipo de vivienda, ubicación de la vivienda en zona urbana o rural, tipo de combustible primario para calefacción. Las variables independientes son atributos comunes entre los registros de la encuesta RECS y los registros sintéticos de hogares. Los árboles de inferencia condicional se entrenan en diferentes regiones censales de EE. UU. para descubrir las diferencias regionales. Un hogar RECS Si se selecciona aleatoriamente de los nodos de hoja apropiados del árbol de inferencia condicional y se asigna al hogar sintético Hi cada vez que se ejecuta una nueva simulación. Esta asignación dinámica introduce estocasticidad cuando la simulación se ejecuta para días iguales y/o diferentes.

La población sintética enriquecida (es decir, el resultado del paso de enriquecimiento) permite la codificación de comportamientos (tiempo dedicado a diferentes actividades relacionadas con la energía en el hogar), atributos normativos (p. ej., pies cuadrados, edad, ingresos, género), atributos declarativos (p. ej., actividades individuales como una secuencia) y atributos de procedimiento (por ejemplo, comportamientos que capturan dependencias, interacciones, frecuencia de realización de actividades) en el conocimiento requerido para construir perfiles de uso de energía38. La infraestructura sintética se aprovecha para construir seis modelos de uso de energía (Fig. 2). Se sintetizan nueve usos finales para cada hogar. Estos usos finales se dividen en dos partes: cargas controladas termostáticamente (TCL) y uso de electrodomésticos. Para un hogar i, nueve usos finales publicados en los datos son:

Climatización (Ehvac). Esta categoría incluye la carga eléctrica de calefacción y refrigeración proveniente del aire acondicionado central durante los días calurosos y la calefacción/calefacción eléctrica utilizada durante los días fríos. Esta es una carga TCL.

Consumo de agua caliente sanitaria (Eh2o). Energía consumida para calentar el agua que se necesita para actividades de aseo personal como ducha/baño, actividades de lavandería como uso de lavadora y lavavajillas. Esta es una carga TCL.

Lavavajillas (Edwasher). Energía utilizada por los lavavajillas.

Lavadora De Ropa (Ecwasher). Energía utilizada por las lavadoras de ropa eléctricas.

Secadora de Ropa (Ecdyer). Energía consumida por el secador.

Cocinar (Ecook). Energía consumida por la cocina eléctrica, el horno y otros aparatos de cocina como cafetera, microondas, tostadora, etc.

Carga de enchufes diversos (Emisc). Este tipo de energía indica carga de enchufe atribuida a actividades de limpieza y dispositivos electrónicos como TV, computadoras y otros aparatos electrónicos más pequeños.

Refrigeración (Erefr). Energía consumida por los frigoríficos.

Iluminación (Elight). Energía consumida por las unidades de iluminación.

La Tabla 3 describe las notaciones utilizadas en las secciones de metodología. La energía total sumada durante 24 horas (\({E}_{i}^{{\rm{total}}}\)) de un hogar i viene dada por las siguientes ecuaciones:

Según la Administración de Información Energética (EIA) de EE. UU.39, la climatización es responsable de la mayor proporción del consumo de energía en los hogares. El modelo HVAC calcula cuánta energía se requiere para mantener la temperatura ambiente/confort en el interior. Esto depende de factores que van desde el área de la casa, la temperatura exterior, la eficiencia del equipo HVAC, etc. El comportamiento de los ocupantes con respecto a los ajustes del termostato en diferentes estaciones y la ocupación del hogar durante el día juegan un papel importante en la comprensión de los niveles de confort térmico y su efecto en el consumo de electricidad. En la literatura se presentan enfoques estadísticos y de ingeniería40 para simular el consumo de energía de calentadores/hornos y acondicionadores de aire41,42,43,44. Adoptamos el enfoque basado en ingeniería de Subbiah et al.44 donde la función de calentar/enfriar un hogar Hi a intervalos horarios se define como:

Aquí \({E}_{i,t}^{{\rm{hvac}}}\) es la energía consumida por el hogar Hi al final de la hora t en kWh por equipos de calefacción/refrigeración para mantener el confort térmico. FloorAreai es el área del piso y WallAreai es el área de la pared (extrapolada del área del piso44) de Hi. Las cantidades Rtecho y Rwall son valores R (nivel de aislamiento) para hogares en diferentes zonas climáticas, mientras que η se define en la Tabla 3. A continuación, ΔT es la diferencia absoluta entre \({T}_{t}^{in}\ ) y \({T}_{t}^{{\rm{out}}}\), y \({T}_{t}^{{\rm{in}}}\) es la temperatura del termostato interior a la hora t. La temperatura exterior por hora (\({T}_{t}^{{\rm{out}}}\)) se obtiene de los datos NLDAS de NOAA mencionados en la Tabla 2. Los datos de eficiencia y aislamiento se obtienen de las pautas publicadas por la EIA. Todos los demás atributos del hogar se obtienen de la población sintética enriquecida. Dependiendo de los patrones de ocupación a lo largo del día, los cambios en el comportamiento del termostato se asignan a cada hogar. Las temperaturas umbral de calefacción y refrigeración para los tiempos de encendido/apagado de los electrodomésticos se toman del estudio del termostato publicado por NREL en 201745.

La EIA muestra que entre el 17% y el 32% del uso de energía en los hogares se atribuye al uso de agua caliente sanitaria (ACS). La literatura muestra modelos utilizados para estimar la demanda de agua caliente en múltiples resoluciones temporales: intervalos anuales, diarios, horarios y minutos. Uno de los modelos iniciales para estimar los perfiles de carga de la demanda de agua caliente fue desarrollado en 2001 por Jordan et al.46 para un período de un año para resoluciones temporales de 1 min, 6 min y 1 hora. Sin embargo, este trabajo no considera tasas de flujo históricas ni factuales para determinar cuánta agua caliente (galones/día) utiliza un hogar. Se desarrolló un documento de seguimiento para sintetizar los perfiles de demanda de agua para Suiza47 calibrando este modelo utilizando datos de campo. En 2010, Hendron et al.48 del Laboratorio Nacional de Energía Renovable (NREL) desarrollaron un modelo para simular el calendario anual de eventos de ACS para un hogar unifamiliar. El simulador utilizó dos encuestas que recopilaron información sobre la demanda de agua en los hogares de EE. UU. durante cinco años. categorías: lavabo, bañera, ducha, lavadora y lavavajillas. Este modelo ha sido ampliamente aceptado en la literatura. Un ejemplo reciente de la adaptación del modelo de Hendron es la simulación de la demanda de agua caliente en los hogares canadienses49. El modelo está calibrado para los datos de encuestas recopilados en Canadá y se realizan los ajustes apropiados con respecto a los estilos de vida canadienses.

Para nuestro modelo, utilizamos las distribuciones de duración y caudal de actividades que involucran el uso de agua caliente, como baño/ducha, lavadora y lavavajillas de Hendron et al. Tenga en cuenta que la duración y los caudales pueden tomar valores negativos (Tabla 4). El caudal está limitado a 0,05 gpm y la duración está limitada a 1 minuto para cualquier valor negativo48. La Tabla 4 caracteriza el recuento promedio de eventos diarios, duración y tasas de flujo. Los valores de temperatura del agua caliente para diferentes usos y temperatura de entrada del agua fría se obtienen de estudios realizados por el NREL en diferentes regiones de Estados Unidos50,51,52. Se utiliza un enfoque basado en ingeniería para estimar el uso de agua caliente44,50 en el hogar i para el evento v en el momento t

Los galones de agua caliente \({G}_{v,i,t}^{{\rm{hot}}}\) consumidos por el evento v se calculan como producto del caudal (gpm) y la duración (minutos). Ambas características se extraen de las distribuciones de la Tabla 4. \({E}_{v}^{{\rm{hot}}}\) es la energía consumida por el evento v para calentar \({G}_{v) }^{{\rm{caliente}}}\) galones de agua. Las últimas cuatro entradas de la Tabla 3 muestran la suma de múltiples eventos que ocurren a lo largo del horizonte temporal. Aquí η es la eficiencia de los calentadores de agua eléctricos. Las encuestas realizadas por NREL han demostrado que η es una función compleja de la capacidad de almacenamiento del calentador de agua, el tipo de calentador de agua y la antigüedad del calentador de agua. No hay distribuciones disponibles para η en los estudios actuales. Los datos de campo recopilados de las encuestas del NREL50,51,52 muestran que la eficiencia varía entre el 80% y el 99%. Aquí 0.00189 \(\left(\frac{{\rm{kWh}}}{{\rm{gal}}}^{\circ }{\rm{F}}}\right)\) es una constante de conversión obtenido de Subbiah et al.44, y ΔT es la diferencia de temperatura (°F) entre la temperatura del agua de la red (entrada) \({T}_{m,z}^{{\rm{frío}}}\) para un mes dado m en una zona climática z y la temperatura del agua requerida para un punto final particular. Se obtienen los valores para \({T}_{m,z}^{{\rm{cold}}}\) y \({T}_{v}^{{\rm{hot}}}\) de encuestas NREL50,51. Siempre que el modelo de actividad detecta la presencia de un evento v, calculamos la energía utilizada por el agua caliente para el evento usando la ecuación. 3. Tenga en cuenta que calculamos el uso de energía de agua caliente solo para hogares sintéticos que tienen calentadores de agua eléctricos.

La iluminación representa entre el 5 % y el 10 %39 del consumo; el uso de iluminación en entornos residenciales se caracteriza principalmente por las condiciones de iluminación exterior y los horarios de ocupación de los hogares53. Widen et al.54 adoptan un enfoque de cadena de Markov para modelar la demanda de iluminación en los hogares suecos utilizando datos de uso del tiempo en Suecia. Palacios-García55 desarrolla un modelo estocástico para la estimación de la iluminación residencial de la ciudad de Córdoba en España, basado en un modelo desarrollado por Stokes et al.56 utilizando datos de iluminación medidos para 100 hogares del Reino Unido. Richardson et al.57 desarrollaron otro modelo estocástico para hogares del Reino Unido utilizando datos de uso del tiempo y datos de iluminación de la Administración de Información Energética (EIA).

Construimos un modelo estocástico para la demanda de iluminación en viviendas de EE. UU. basándose en conceptos de diseño del trabajo realizado por Richardson et al.57, Stokes et al.56 y Paatero & Lund et al.58. El modelo de Richardson es particularmente interesante ya que admite características importantes del uso ligero, como el "couso" y los "pesos relativos". El modelo utiliza el concepto de 'couso' de la iluminación, es decir, la iluminación de una vivienda suele ser compartida por los miembros del hogar que se encuentran en el mismo espacio de la vivienda y al mismo tiempo. El modelo también considera que no todas las unidades de iluminación se utilizan con la misma frecuencia (por ejemplo, las habitaciones frecuentemente ocupadas, como la cocina y la sala de estar, utilizarán más iluminación que otras habitaciones) y emplea un esquema de ponderación para indicar el uso relativo.

Las condiciones de iluminación exterior se modelan utilizando series temporales de irradiancia. Se obtiene de NSRDB que se describe en la Tabla 2. Los datos de irradiancia horaria se recopilan utilizando la API de NSRDB para los 365 días del año 2014 en la resolución del tramo censal para los EE. UU. Por lo tanto, todos los hogares sintéticos en un tramo censal utilizan la misma serie temporal de irradiancia para un día determinado. El perfil de ocupación por hora a nivel de hogar \(\left\langle {O}_{i,0},{O}_{i,1},\ldots ,{O}_{i,23}\right\rangle \) se desarrolla examinando las actividades de los miembros sintéticos despiertos del hogar de Hi en casa. La presencia de ocupantes despiertos en la vivienda apoya la toma de decisiones sobre el evento de encendido de la luz. La distribución de unidades de iluminación en los hogares se deriva de la encuesta RECS. En general, la distribución de las unidades de iluminación de un Hi se toma del Si correspondiente. Se consideran tres tipos de unidades de iluminación: incandescentes, CFL y LED. Las clasificaciones de potencia de las categorías de unidades de iluminación se toman de un estudio realizado por la Bonneville Power Administration (EE. UU.) en el que se analizaron los accesorios de iluminación de una muestra de 161 residencias del noroeste59. Para un día de simulación determinado, definimos un umbral de irradiancia (Irri) para un hogar Hi. Indica que los ocupantes pueden considerar encender las luces cuando la iluminación exterior sea inferior a Irri. Irri se muestra a partir de una distribución normal57 Normal(60, 10). Todas las notaciones utilizadas en el modelo se describen en la Tabla 3. Los datos de iluminación anual para los EE. UU. se resumen para diferentes tamaños de hogares de la encuesta RECS.

La literatura muestra que el uso de iluminación aumenta con la cantidad de ocupantes en el hogar; sin embargo, el uso de iluminación no se duplica por cada ocupante agregado en la casa. Para simular el uso de iluminación compartida, el concepto de ocupación efectiva57 de un hogar \(\left\langle {\widehat{O}}_{i,0},{\widehat{O}}_{i,t}, Se introduce \ldots ,{\widehat{O}}_{i,23}\right\rangle \). La ocupación efectiva (\({\widehat{O}}_{i,t}\)) se define como una función de la ocupación activa (Oi, t). Los valores de ocupación efectiva se obtienen escalando la demanda anual de iluminación según el tamaño del hogar, de modo que la ocupación efectiva de una vivienda con un ocupante activo sea uno. El siguiente paso es obtener los detalles de las unidades de iluminación de un hogar. La proporción de tipos de unidades de iluminación se obtiene de un hogar RECS Sl que coincide con Hi (Modelo RECS). Las clasificaciones de potencia están adjuntas a cada unidad de iluminación. En general, no todas las unidades de iluminación se utilizan con la misma frecuencia. Esto se observa en estudios bibliográficos como el informe DECADE60. La frecuencia de uso de unidades de iluminación en los hogares se puede modelar aproximadamente como una curva logarítmica natural57; sin embargo, no se han presentado métodos formales en la literatura debido a la falta de datos cuantitativos. Usamos la curva logarítmica natural presentada en Richardson et al.57 para modelar el uso relativo de una unidad de iluminación. Una vez asignados los pesos a las unidades de iluminación, la probabilidad de un evento de encendido para cada unidad de iluminación se calcula en un intervalo de tiempo regular (en nuestro caso, 1 hora). La probabilidad de un evento de encendido \({P}_{b}^{{\rm{on}}}\) de la unidad de iluminación b en la hora t se calcula como

Aquí bweight se toma como muestra de una curva logarítmica natural, γ es una constante de calibración utilizada para lograr el consumo de iluminación anual apropiado para EE. UU. y \({\widehat{O}}_{i,t}\) es la ocupación efectiva de Hola a la hora t. Si se produce un evento de conexión, se calcula el consumo de energía de la respectiva unidad de iluminación b. La duración de la iluminación se elige aleatoriamente de la distribución descrita en Stokes et al.56.

La energía consumida por un refrigerador depende de su tamaño, antigüedad, temperatura ambiente y varios otros factores como se describe en la literatura. Consumen entre el 3% y el 5% del uso total de energía residencial. Shimoda et al.42 muestran que el consumo diario de refrigerador se ve afectado por la temperatura exterior, mientras que Tsuji et al.43 muestran una relación lineal entre la temperatura exterior y la demanda anual de refrigerador. Ambos trabajos se realizan en el contexto de refrigeradores en Japón. El Laboratorio Nacional Lawrence Berkeley en California utiliza datos de uso de energía medidos en campo de aproximadamente 1500 refrigeradores y congeladores para desarrollar un modelo que predice el uso anual de diferentes categorías de congeladores y refrigeradores61. Todos los modelos anteriores recopilaron datos relevantes del campo o utilizaron encuestas detalladas sobre refrigeración.

Nuestro enfoque es desarrollar un modelo de regresión para predecir el uso diario del refrigerador (kWh/día) de un hogar (\({E}_{i}^{{\rm{refr}}}\)) en función del ambiente exterior. temperatura. El modelo se entrena con los datos de uso medidos del refrigerador de Pecan Street Inc, donde se utiliza el 30% del total de datos medidos para entrenar y probar el modelo. Los datos del 30% se obtienen realizando un muestreo estratificado basado en zonas climáticas y intervalos de temperatura promedio diaria. La variable dependiente es el uso diario del refrigerador \({E}_{i}^{{\rm{refr}}}\) en kWh/día para Hi. Las variables independientes son la temperatura promedio diaria \({\widehat{T}}^{{\rm{out}}}\) (°F) y atributos categóricos que indican tres zonas climáticas principales. El perfil de carga de 24 horas de un refrigerador \(\left\langle {E}_{i,0}^{{\rm{refr}}},{E}_{i,1}^{{\rm{refr }}},\ldots ,{E}_{i,23}^{{\rm{refr}}}\right\rangle \) se construye a partir del uso diario, y la variación en el uso horario del refrigerador es modelado utilizando una distribución guassiana. El frigorífico funciona en modo automatizado/standby, es decir, la presencia de los ocupantes no influye en el consumo energético de esta actividad43,44. Por lo tanto, calcular el perfil de 24 horas del refrigerador agregando un pequeño ruido gaussiano a la carga horaria puede considerarse aceptable. La sección de validación muestra que la adición de este ruido crea una buena coincidencia con los datos reales.

El consumo de energía en un hogar atribuido al uso de electrodomésticos y a la carga de enchufes es del 20% al 26%. Esta energía es el resultado de los deseos de los ocupantes de realizar actividades como bañarse, preparar comidas calientes, usar el lavavajillas, lavar la ropa, cargar aparatos electrónicos como televisores y computadoras, o usar cualquier otro electrodoméstico que consuma electricidad. En este modelo se utilizan las ecuaciones 1b,c. Con base en los usos finales antes mencionados, el comportamiento de uso de los electrodomésticos se caracteriza43 por el modo operativo de los electrodomésticos, la duración del funcionamiento, el consumo de energía, el límite de ocurrencia de eventos diarios y la tasa de saturación. El modo de funcionamiento de los electrodomésticos describe el funcionamiento de los electrodomésticos y el comportamiento relacionado que se puede clasificar en tres tipos: automático (el uso del electrodomésticos es independiente de la persona), semiautomático (electrodomésticos encendidos por un miembro del hogar pero apagados automáticamente) y manuales (electrodomésticos encendidos por un miembro del hogar pero apagados automáticamente). apagar y encender manualmente). La tasa de saturación se puede utilizar para determinar la presencia y/o penetración de determinados electrodomésticos en los hogares. Generalmente, el modo de funcionamiento de los aparatos y la tasa de saturación son de naturaleza determinista. Sin embargo, parámetros como la probabilidad de que ocurra la actividad, la hora de inicio, la duración, el consumo de energía y la ocurrencia máxima varían de un hogar a otro y de un día a otro. En general, algunos usos de electrodomésticos pueden superponerse y/o ocurrir en paralelo.

La Tabla 6 describe todas las actividades modeladas y los aparatos relacionados, sus modos de operación, ocurrencias diarias máximas permitidas, duración de la actividad y consumo de energía. Las distribuciones marcadas con un asterisco (*) indican que están modeladas mediante criterio de ingeniería y/u otras fuentes como Energy Calculator (energyusecalculator.com). Las distribuciones de potencia para lavavajillas se obtienen de una encuesta realizada por NIST62,63. Las clasificaciones de potencia y las distribuciones de duración de los aparatos de lavandería se derivan de la literatura27,44 y de encuestas63; Las clasificaciones de potencia para electrodomésticos en la actividad de cocina incluyen hornos eléctricos, microondas y estufas eléctricas (quemadores pequeños y grandes). Las distribuciones de clasificación de energía para estos electrodomésticos se derivan del estudio de eficiencia del NIST64, y las duraciones de uso de los electrodomésticos se obtienen de los datos de ATUS, donde el límite máximo para actividades de cocina tiene un límite de tres. Se observan ejemplos de clasificaciones de potencia para televisores a partir de informes EnergyStar65 y se modelan utilizando una distribución normal. La duración de la actividad televisiva se modela como una distribución logarítmica normal después de examinar los datos de la encuesta ATUS. Las clasificaciones de energía para la actividad de uso de computadoras se derivan de un pequeño estudio realizado por EnergyStar66. Los valores estándar para la duración de la carga se utilizan de fabricantes de portátiles de renombre. Los datos relacionados con el vacío se obtienen del informe de vacío de EnergyStar y de una encuesta realizada por Electrolux que abarcó a 28.000 consumidores de 23 países, incluido EE.UU.67,68. Suponemos que todos los hogares tienen aspiradoras. La frecuencia de uso de la aspiradora es de 1 a 5 veces por semana68 y el número máximo de ocurrencias diarias es 1. Suponer una distribución normal para las clasificaciones de potencia y la duración del uso de los electrodomésticos es razonable después de examinar resultados rudimentarios de encuestas/informes. Los resultados del estudio de uso de agua caliente realizado por NREL48,52 como se resume en la Tabla 4 muestran que la mayoría de los procesos se pueden modelar como una distribución normal.

El modelo de actividad simula el uso de electrodomésticos basándose en indicadores de actividad proporcionados por ATUS cuando el ocupante está presente en la casa. Teniendo en cuenta la presencia de electrodomésticos en cada hogar (de hogares RECS coincidentes), los diarios de uso del tiempo de los adultos en la población sintética y la frecuencia de uso de electrodomésticos como lavavajillas y lavandería, y actividades como cocinar se toman del hogar RECS. El modelo de actividad se centra en las actividades realizadas por un individuo en casa. Al igual que la iluminación, los miembros del hogar comparten actividades como cocinar, pasar la aspiradora y actividades de ocio como mirar televisión. A continuación se describe un procedimiento para generar la secuencia de actividades a nivel del hogar ActSeqi. Sea M el número de miembros adultos del hogar sintético. Entonces cada miembro del hogar Pi, j tiene una secuencia de actividades ActSeqi, j. El objetivo es encontrar una secuencia de actividades a nivel doméstico ActSeqi compuesta de n actividades (actividades relacionadas con el uso de electrodomésticos individuales + compartidas) de modo que la secuencia satisfaga las siguientes restricciones:

Cada actividad se realiza cuando al menos un ocupante está en casa.

El límite de uso repetido se respeta para cada tipo de actividad.

Se considera la presencia de electrodomésticos para actividades como lavavajillas y aparatos de lavandería.

Una vez que se cumplen las restricciones anteriores, se selecciona aleatoriamente una hora de inicio para cada actividad a partir de la duración de la actividad informada por ATUS. La duración real y las potencias nominales de los electrodomésticos utilizados en diferentes actividades se eligen en la Tabla 6. La Tabla 5 proporciona una descripción general de todos los modelos de energía (uso final) en el marco.

El conjunto de datos de todo el año 2014 para hogares estadounidenses está disponible públicamente para su descarga desde el repositorio net.science a través de University of Virginia Dataverse69. El conjunto de datos está disponible en forma de archivos csv. Está organizado en carpetas según fecha y estado. La Figura 4 muestra la jerarquía de la organización de datos y las plantillas de nombres de archivos. Cada archivo corresponde a un identificador de condado de EE. UU. y una fecha. Un identificador de condado es un código FIPS. Los códigos FIPS son números que identifican de forma única áreas geográficas según el censo de EE. UU. Un registro del expediente corresponde a un hogar sintético. El registro incluye metadatos sintéticos del hogar y datos energéticos para esa fecha en particular. Los atributos del registro de datos se muestran en la Fig. 5. Todos los datos relacionados con la energía están en kWh. Todos los datos de energía tienen una marca de tiempo según las zonas horarias locales del país. En las descargas también se incluye un libro de códigos de encabezado de datos. Tenga en cuenta que este trabajo fue revisado por la Junta de Revisión Institucional (IRB) de la Universidad de Virginia y se determinó que estaba exento de la aprobación de la junta IRB, ya que este proyecto de investigación no involucró investigación con sujetos humanos.

Organización de datos. El conjunto de datos está disponible en forma de archivos csv. Los archivos están organizados por fechas (temporales) y estados (espaciales). El texto azul indica el tipo (por ejemplo, carpeta, archivo, registro). El texto entre corchetes angulares indica plantillas de nomenclatura de carpetas y archivos. Un archivo csv de registro contiene datos y metadatos sobre el uso de energía para un hogar sintético en la población SPEW. Habrá un expediente por condado y fecha. Un día genera varios GB de datos.

Se presentan tres estudios para validar los perfiles energéticos sintéticos. El primer estudio cuantifica la similitud entre las distribuciones de probabilidad de uso de energía real y sintética utilizando la distancia de Jensen-Shannon y Hellinger. Las comparaciones se realizan por uso final para datos reales y sintéticos en todas las ubicaciones representativas de los EE. UU. Se observan fuertes similitudes en las distribuciones de uso de electrodomésticos entre datos reales y sintéticos, así como entre ubicaciones espaciales. Las cargas de TCL muestran diferencias en las distribuciones entre ubicaciones. El segundo estudio examina las variaciones en la serie temporal de uso de energía de 24 horas en datos reales y sintéticos en todas las ubicaciones representativas de los EE. UU. Descubrimos patrones únicos de uso de energía en los conjuntos de datos reales y sintéticos y estudiamos similitudes en los patrones utilizando el aprendizaje no supervisado. Introducimos dos métricas en el proceso: cobertura y cercanía. Los datos sintéticos tienen patrones similares a los de los datos reales. El último estudio se centra en observar tendencias en el uso de energía sintética en diferentes lugares representativos de los EE. UU. Observamos que los datos sintéticos pueden incorporar los efectos de una combinación de variables como el clima, la irradiancia, los atributos de los edificios y las características demográficas a nivel de los hogares. uso de energía. El estudio es una demostración rápida de la variabilidad del uso de energía en múltiples niveles espacio-temporales en diferentes usos finales.

La sección restante de V&V se describe a continuación. Primero, describimos los desafíos en la validación de un gran conjunto de datos sintéticos para el uso de energía. Luego, resaltamos las resoluciones temporales y espaciales de los datos que se consideran en los experimentos de validación. A continuación, se describen brevemente los conjuntos de datos reales (datos reales/registrados/actuales) utilizados para la evaluación. A esto le sigue la descripción de la configuración experimental y los resultados.

Validar la calidad de los datos de series temporales sintéticas a gran escala para una región tan grande como Estados Unidos es un desafío, debido a la gran extensión, diversidad y climas contrastantes del país. Uno de los desafíos de validar una serie temporal de consumo de energía a nivel doméstico es la gran variedad y variabilidad de los patrones de carga dentro y entre hogares. Además de los elementos externos como el clima y las características de los edificios, los estilos de vida y las posibilidades de los consumidores desempeñan un papel vital en la configuración de la demanda, como una curva con un pico matutino o una curva con un pico pequeño por la tarde y un pico pronunciado por la noche. Esto conduce a un gran espectro de variaciones y patrones en el uso de la energía. Por lo tanto, se requieren análisis comparativos en profundidad de datos sintéticos con datos reales. Sin embargo, está condicionado a la disponibilidad de una cantidad razonable de datos reales representativos. Aquí, empleamos datos reales/registrados, como datos de investigación de carga, datos de medición de uso final y datos de medidores inteligentes de diez ubicaciones en el país que son representativas de las zonas climáticas de EE. UU. (Tabla 7). La disponibilidad de datos públicos de medidores inteligentes en los EE. UU. es limitada, lo que puede causar un posible sesgo hacia la muestra seleccionada de hogares y puede no ser espacialmente representativa. Por lo tanto, es importante enmarcar nuestra comprensión de la validación en este contexto.

Abordamos la calidad de los datos sintéticos de consumo de energía en dos cualidades intrínsecas de los datos de uso de energía: magnitud (uso durante 24 horas) y forma de carga (patrón de consumo). La magnitud y la forma de la carga se pueden examinar a través de los ejes temporal (hora/día/mes/año) y espacial (hogar/zona censal/ciudad/condado/estado/zonas climáticas). Así, el proceso de verificación y validación (V&V) cubre:

Representatividad espacial y resoluciones. Debido a la disponibilidad limitada de datos reales, definimos la representatividad espacial eligiendo al menos una ubicación en cada zona climática de EE. UU. para llevar a cabo experimentos de validación. Las principales zonas climáticas70 en los Estados Unidos contiguos son las siguientes: (i) marina, (ii) cálida-seca/mixta-seca, (iii) cálida-húmeda, (iv) mixta-húmeda y (v) fría/muy -frío. Luego se realizan comparaciones según las resoluciones de los hogares y de las ciudades/condados.

Representatividad temporal y resoluciones. La representatividad temporal se estudia observando similitudes entre los perfiles de demanda horaria reales y sintéticos. Además, se estudia el uso de energía diario y estacional para diferentes ubicaciones.

Uso desagregado de energía. Tenga en cuenta que publicamos datos desglosados ​​sobre el uso de energía a nivel de hogares. Por lo tanto, es posible un nivel más fino de evaluación, como un subtipo de uso de energía (por ejemplo, HVAC, cocina, etc.), en varios niveles temporales y espaciales.

Todos los conjuntos de datos reales utilizados en el proceso V&V se enumeran en la Tabla 7. Los conjuntos de datos registrados se obtienen de Pecan Street Dataport23, Northwest Energy Efficiency Alliance (NEEA)71, National Rural Electric Cooperative Association (NRECA). El conjunto de datos de Los Alamos se obtiene de un repositorio público de intercambio de datos Dryad72. Desafortunadamente, no tenemos metadatos sobre los hogares (por ejemplo, tamaño del hogar, tipo de vivienda, etc.) en estos conjuntos de datos. Los conjuntos de datos solo tienen series temporales de uso de energía.

Se presentan tres estudios para cubrir la naturaleza temporal, espacial y desagregada de las series temporales sintéticas:

I. Comparación del uso de energía final real y sintético (magnitud)

II. Comparación de patrones de uso de energía reales y sintéticos (forma/estructura)

III. Observación de diferencias y similitudes en datos de uso de energía sintética en ubicaciones espacialmente representativas

En este experimento, se comparan las distribuciones de datos de uso final diarios sintéticos y reales mediante métricas estadísticas. Una forma de comparar estas distribuciones es midiendo la distancia entre las distribuciones de uso final real y sintética. Se pueden utilizar muchas métricas para realizar esta tarea (por ejemplo, la divergencia de Kullback-Leibler (KL), la distancia de Hellinger, la distancia de variación total (TVD), la métrica de Wasserstein, la divergencia de Jensen-Shannon (JS) y la estadística de Kolmogorov-Smirnov. (KANSAS)). Klemenjak et al.26 utilizan la distancia JS y la distancia Hellinger como ejemplos para comparar las distribuciones del uso de energía de los electrodomésticos entre diferentes conjuntos de datos. En esta sección se implementa un método similar utilizando la distancia JS y la métrica de distancia Hellinger. En nuestro caso, calcular las distancias entre las distribuciones diarias de uso final nos permite realizar comparaciones regionales, así como comparaciones entre conjuntos de datos reales y sintéticos.

La distancia de Jensen-Shannon es la raíz cuadrada de la divergencia de Jensen-Shannon73. El rango de esta métrica oscila entre [0, 1] donde 0 implica que las distribuciones son similares. Preferimos la divergencia JS sobre la divergencia KL ya que es una medida simétrica. Si P y Q son dos vectores de probabilidad, entonces la distancia JS JS(P, Q) viene dada por

donde M es la media puntual de P y Q y KL es la divergencia de Kullback-Leibler. Para complementar nuestro estudio, utilizamos la distancia de Hellinger como segunda métrica para cuantificar la similitud entre dos distribuciones de probabilidad. La distancia de Hellinger también es una medida simétrica. Su rango de valores es [0, 1] con 0 que codifica que las distribuciones son similares. La distancia de Hellinger de dos vectores de probabilidad P y Q se denota por H(P, Q) y se define como

donde k es la longitud de los vectores y pi, qi son los elementos i de los vectores P y Q, respectivamente.

El uso diario de energía final (por ejemplo, \({E}_{i}^{{\rm{hvac}}}\)) a nivel doméstico se compara en los datos reales y sintéticos para cada ubicación especificada en la Fig. 6. Los vectores P y Q denotan valores en un único uso final para dos conjuntos de datos. Las Figuras 6a-c enumeran las distancias JS y las Figuras 6d-f enumeran las distancias Hellinger para usos finales seleccionados (HVAC, refrigerador, electrodomésticos de cocina). Cada matriz representa distancias entre dos distribuciones de uso de energía para un uso final. Los encabezados de fila y columna representan diferentes fuentes de datos y diferentes regiones y cada celda representa el valor de similitud/distancia de la distribución de probabilidad en forma de mapa de calor donde la barra muestra el rango de los valores en una escala continua.

Atributos de datos. Se encuentran disponibles perfiles horarios de demanda de energía de los hogares desglosados ​​durante 24 horas. 1–24 indica la hora que comienza a medianoche. Se describen ocho perfiles de uso final (líneas 3 a 10).

Columna izquierda: matrices de distancias de Jensen-Shannon. Columna derecha: matrices de distancias de Hellinger. Cada una de las columnas muestra las matrices de distancia de Jensen-Shannon y de distancia de Hellinger entre distribuciones de probabilidad de uso final. Cada matriz representa distancias entre dos distribuciones de uso de energía para un uso final particular (por ejemplo, HVAC, refrigerador, cocina). Los encabezados de fila y columna de la matriz representan diferentes fuentes de datos y diferentes regiones y cada celda representa el valor de similitud/distancia de la distribución de probabilidad en forma de mapa de calor, donde la barra muestra el rango de los valores en una escala continua.

Las tablas de distancias de JS y Hellinger para usos finales muestran grandes similitudes (la distancia es cercana a cero). Además, dentro de cada matriz se realizan tres tipos de comparaciones. Calculamos la similitud entre distribuciones de uso final para diferentes regiones dentro de datos sintéticos, diferentes regiones dentro de datos reales y diferentes regiones en diferentes fuentes de datos (es decir, datos reales y sintéticos). Para el uso de electrodomésticos (por ejemplo, cocinar), las distribuciones son bastante similares entre regiones y fuentes de datos. Esto respalda los hallazgos de la Fig. 11 de que existen similitudes significativas entre diferentes regiones en cuanto al consumo diario de energía sintética de diferentes electrodomésticos. Para el uso final de HVAC, se observa que las distribuciones se separan entre regiones para ambas fuentes de datos: sintéticas y reales. Esto es particularmente cierto debido a la fuerte asociación de HVAC con las condiciones de temperatura exterior/ambiental y el lapso de tiempo durante el cual prevalecen estas condiciones de temperatura (por ejemplo, se observan temperaturas más cálidas durante más tiempo en Texas (TX)).

En esta sección se evalúan las series temporales de uso de energía sintética utilizando los conceptos de diversidad, cobertura y cercanía. La diversidad en los patrones de uso de energía se captura segmentando la serie temporal normalizada \(\left\langle {\overline{e}}_{0},\ldots ,{\overline{e}}_{23}\right\rangle \ ) utilizando técnicas de aprendizaje no supervisadas como la agrupación. A esto le sigue el estudio de la cobertura en términos de qué porcentaje de la población de la serie temporal sintética está representada en la población de la serie temporal real y viceversa. Por tanto, la cobertura se utiliza para medir la diversidad. Sin embargo, aprender únicamente la cobertura no es suficiente. Es necesario medir la precisión de las coincidencias encontradas. Por lo tanto, introducimos la métrica de cercanía. Estudia qué tan cerca (por ejemplo, dist(i, j) están los puntos de datos sintéticos y reales.

Sean \({\mathcal{R}}\) y \({\mathcal{S}}\) el conjunto de formas de carga de series temporales de uso de energía real y sintética. Sea \({K}_{{\mathcal{R}}}\) el número de formas de carga únicas (segmentos/patrones/grupos) que se encuentran en el conjunto \({\mathcal{R}}\). Luego, definimos la \(cobertura({\mathcal{S}})\) como una relación

Por lo tanto, \(cobertura({\mathcal{S}})\) refleja el grado en que las muestras del conjunto \({\mathcal{S}}\) cubren los patrones en el conjunto \({\mathcal{R}}\ ). De manera similar, si \({K}_{{\mathcal{S}}}\) es el número de segmentos únicos en el conjunto \({\mathcal{S}}\), entonces, \(coverage({\mathcal{ R}})\) refleja el porcentaje de patrones únicos en el conjunto \({\mathcal{S}}\) cubiertos por puntos de datos en el conjunto \({\mathcal{R}}\). La cobertura está limitada entre 0 y 1. La Figura 13b muestra \(cobertura({\mathcal{S}})\) y \(cobertura({\mathcal{R}})\) a medida que K varía.

Para medir la cercanía, calculamos la distancia de la serie temporal individual a su respectivo centro/representante del grupo. Si \({K}_{{\mathcal{R}}}\) es el número de conglomerados en el conjunto \({\mathcal{R}}\), entonces, la cercanía(\({\mathcal{S} }\), \({\mathcal{R}}\)) del conjunto \({\mathcal{S}}\) al conjunto \({\mathcal{R}}\) se mide comparando las distribuciones de distancias de series temporales individuales \(i\in {\mathcal{R}}\) y \(j\in {\mathcal{S}}\) en cada grupo \(c\in {K}_{{\mathcal{R }}}\) al centro respectivo/serie temporal representativa del clúster. La Figura 13b ilustra el esquema de construcción de las distribuciones de distancia. Sean \({P}_{{\mathcal{R}}}\) y \({P}_{{\mathcal{S}}}\) los vectores de probabilidad de distancias de conjuntos \({\mathcal{ R}}\) y \({\mathcal{S}}\) respectivamente. Para medir el grado de cercanía, comparamos las dos distribuciones de probabilidad usando la distancia de Hellinger \({\rm{H}}({P}_{{\mathcal{R}}},{P}_{{\mathcal{S }}})\) (Ecuación 6). Si las distribuciones \({P}_{{\mathcal{R}}}\) y \({P}_{{\mathcal{R}}}\) son similares, entonces decimos que el conjunto \({\mathcal {S}}\) está cerca del conjunto \({\mathcal{R}}\).

La cercanía está limitada entre 0 y 1. 0 implica que los dos conjuntos están cerca. Tenga en cuenta que la cercanía no es una métrica simétrica, es decir, \(closeness({\mathcal{S}},{\mathcal{R}})\ne closeness({\mathcal{R}},{\mathcal{S}})\ ). La Figura 13b describe la variación en la puntuación de similitud de la probabilidad con diferente número de segmentos K.

Ahora, describimos brevemente la configuración experimental. Se consideran dos casos para examinar la cobertura, la cercanía y la solidez de las agrupaciones de conglomerados (k). Para cada caso, la serie temporal de uso de energía se normaliza, lo que da como resultado una forma de carga \(\langle {\overline{e}}_{0},\ldots ,{\overline{e}}_{23}\rangle \). Elegimos la normalización por consumo total (Ec. 9) para considerar los efectos pronunciados de la carga máxima en el perfil. Las preferencias o estilos de vida de los hogares generalmente pueden capturarse mediante una o más formas de carga74, por lo que elegimos esta representación para descubrir patrones en los datos. Por lo tanto, cada \(i\in {\mathcal{R}}\) y \(j\in {\mathcal{S}}\) son vectores de uso de energía normalizados de longitud 24.

En el primer caso (Caso 1), generamos patrones \({K}_{{\mathcal{R}}}\) a partir del conjunto \({\mathcal{R}}\) agrupando los vectores reales normalizados de uso de energía. utilizando el algoritmo de agrupamiento de k-medias con distancia euclidiana. A esto le sigue la asignación de una etiqueta de grupo \(k\in {K}_{{\mathcal{R}}}\) a cada serie temporal de uso de energía sintética \(j\in {\mathcal{S}}\). Sea ck el vector central/de representación del grupo k. Luego, \(j\in {\mathcal{S}}\) se asigna al grupo cuya distancia al centro del grupo es mínima desde j y está dada por \(min(dist(\;j,{c}_{0} ),\ldots ,dist(j,{c}_{{K}_{{\mathcal{R}}}}))\). Luego, calculamos la cobertura de datos sintéticos \(cobertura({\mathcal{S}})\) y la cercanía de los datos sintéticos a los datos reales entre todos los grupos como \(closeness({\mathcal{S}},{\mathcal {R}})\). En el Caso 2, generamos \({K}_{{\mathcal{S}}}\) grupos a partir del conjunto \({\mathcal{S}}\) (datos sintéticos) segmentando los vectores de uso de energía normalizados usando k -significa algoritmo de agrupamiento con distancia euclidiana. A esto le sigue la asignación de una etiqueta de grupo \(k\in {K}_{{\mathcal{S}}}\) a cada serie temporal de uso de energía real \(i\in {\mathcal{R}}\). i se asigna al grupo cuya distancia al centro del grupo es mínima desde i y está dada por \(mi{n}_{\forall k\in {K}_{{\mathcal{S}}}}dist(i,{ c}_{k})\). Luego, calculamos la cobertura de datos reales en grupos sintéticos \(cobertura({\mathcal{R}})\) y la cercanía de datos reales y datos sintéticos entre todos los grupos sintéticos como \(cercanía({\mathcal{R}} ,{\mathcal{S}})\).

Los resultados de ambos casos se resumen en la Fig. 8. Se observa una cobertura del 100% en ambos casos para diferentes valores de k. Las observaciones sobre la métrica de cercanía son interesantes. La distancia de Hellinger es cercana a cero en todos los escenarios, sin embargo, hay una ligera absorción en el valor a medida que k aumenta. Inspeccionamos esto más a fondo en la Fig. 7. La Figura 7 muestra histogramas de distancias de puntos de datos reales y puntos de datos sintéticos desde su centro de grupo asignado. En el caso 1, la distribución de distancias de puntos de datos sintéticos es ligeramente más amplia que la distribución de distancias de puntos de datos reales para todo k. Por lo tanto, vemos una distancia de cercanía (\({\mathcal{R}},{\mathcal{S}}\)) en la figura 8c. A medida que k aumenta, se observa que algunos conglomerados individuales tienen una distribución de distancia amplia y/o bimodal, lo que indica que hay puntos de datos que están muy cerca del centro del conglomerado mientras que unos pocos están lejos. Esta diferencia es evidente a medida que aumenta el número de grupos.

Ejemplo de cercanía en diferentes casos con k variable. Las figuras muestran las distancias de los puntos de datos de los conjuntos \({\mathcal{R}}\) y \({\mathcal{S}}\) a su respectivo centro de grupo. (a) demuestra histogramas de distancias para diferentes k. El gráfico de la izquierda es para puntos de datos reales y el de la derecha es para puntos de datos sintéticos. Luego, calculamos \(cercanía({\mathcal{R}},{\mathcal{S}})\) usando la distancia de Hellinger (corresponde a la línea azul en la Fig. 8c). Para k = 5 se observa un patrón bimodal en distancias para puntos de datos sintéticos que tiende a disminuir a medida que aumenta el número de grupos k. La Figura b muestra histogramas de distancias para diferentes k para el caso 2. El gráfico de la izquierda es para puntos de datos sintéticos y el de la derecha es para puntos de datos reales. \(cercanía({\mathcal{S}},{\mathcal{R}})\) se calcula utilizando la distancia de Hellinger (corresponde a la línea naranja en la Fig. 8c).

Resumen de los dos escenarios de caso. El color naranja se indica para los hallazgos del caso 1, donde agrupamos el conjunto de datos reales \({\mathcal{R}}\) y asignamos una etiqueta de grupo al conjunto de datos sintéticos \({\mathcal{S}}\). El color azul se indica para los hallazgos del caso 1, donde agrupamos el conjunto de datos sintéticos \({\mathcal{S}}\) y asignamos una etiqueta de grupo al conjunto de datos real \({\mathcal{R}}\). (a) ilustra una cobertura del 100% en ambos casos incluso cuando k varía. Esto significa que, en cada caso, al menos un punto de datos pertenece a cada grupo para un k determinado. (b) muestra la cercanía entre los dos vectores de distancia: distancia de los puntos de datos reales en un grupo a su respectivo centroide y distancia de los puntos de datos sintéticos en un grupo a su respectivo centroide. La cercanía viene dada por la distancia de Hellinger, lo que sugiere que un valor de 0 significa que las dos distribuciones son similares. El valor de las distancias es cercano a 0 para todos los valores de k en ambos casos. Sin embargo, se observa una tendencia ascendente a medida que k aumenta. En general, vemos la solidez de los resultados.

El objetivo de este ejercicio de V&V fue verificar si la diversidad y las tendencias de los perfiles de uso de energía real se replican en los perfiles de uso de energía sintéticos. Debido a una muestra sesgada y sesgada de los datos reales sobre el uso de energía, resulta difícil realizar la validación de datos sintéticos. Algunas de las características de los conjuntos de datos reales que dificultan la implementación del uso de métricas de evaluación existentes se mencionan a continuación. No se dispone de información de apoyo sobre los hogares reales (por ejemplo, tamaño del hogar, tipo de vivienda, superficie cuadrada, ajuste del termostato interior). Hemos demostrado que todos estos factores son extremadamente importantes en la generación de demanda de los hogares en un momento dado. Algunos de los hogares en los datos reales también pueden ser participantes en programas de respuesta a la demanda, lo que resulta en formas de carga únicas debido al cambio de la demanda/reducción de la demanda máxima que pueden no encontrarse en hogares que no participan en programas de DR (por ejemplo, datos sintéticos). Los conjuntos de datos reales se recopilan para diferentes años para cada región. Los datos están incompletos para algunas regiones (por ejemplo, las muestras de San Diego no tienen datos de iluminación). El tamaño de la muestra (número de hogares) está muy sesgado. Varía de 9 hogares en Montana a 56000 hogares en Horry, SC. Por lo tanto, es importante señalar que \(| {\mathcal{R}}| < < | {\mathcal{S}}| \) (por ejemplo, el número de hogares simulados en nuestro marco para el estado de Washington es mucho mayor que el de 78 hogares en datos reales para el estado de Washington). Todas estas observaciones se resumen en la Tabla 7.

Este estudio empírico utiliza sólo datos sintéticos para realizar análisis regionales comparativos para examinar similitudes y diferencias entre el uso de energía para diferentes usos finales. Observamos los patrones espacio-temporales y las variaciones en diferentes usos finales con respecto a elementos ambientales como la irradiancia y la temperatura, así como las características demográficas y estructurales de los hogares. Las ubicaciones objetivo seleccionadas son espacialmente representativas de diferentes zonas climáticas de los EE. UU.:

Arlington, Virginia; Condado de Cook, Illinois; Condado de Houston, Texas; el condado de Maricopa, Arizona; Condado de King, Washington

La composición del consumo eléctrico por usos finales se muestra en forma de diagramas circulares en la Fig. 9. La EIA informa las proporciones de los principales usos finales de la siguiente manera: ACS 17–32%, iluminación 5–10%, refrigerador 3– 5%, actividades/electrodomésticos entre 20% y 26%, calefacción de espacios entre 25% y 47% y aire acondicionado entre 5% y 10%. En general, los porcentajes de las principales categorías de uso final se encuentran en rangos similares a los informados por la EIA. HVAC tiene una participación dominante en el consumo de energía en los hogares en comparación con el uso de electrodomésticos y/u otras actividades.

Composición del consumo eléctrico sintético en las localidades objetivo representativas. La calefacción y la refrigeración constituyen la mayor parte del consumo eléctrico residencial. Los refrigeradores consumen energía ligeramente más en regiones más cálidas como Maricopa y Houston. Actividades como lavar platos, lavar la ropa y cocinar representan entre el 8% y el 17% para las diferentes regiones. La iluminación y el calentamiento de agua tienen una proporción constante de consumo en todas las ubicaciones. Las proporciones guardan similitudes con los datos publicados por la EIA.

Las variaciones estacionales del uso de energía para HVAC, refrigeradores y agua caliente se capturan en la Fig. 10. El gráfico muestra la variación en el uso de energía promedio diario de los cuatro usos finales mensualmente junto con la temperatura a lo largo del año 2014. El uso de energía de refrigeradores aumenta ligeramente con la temperatura, mientras que la energía utilizada para calentar el agua disminuye con el aumento de la temperatura.

Cambios mensuales en el uso de energía sintética en usos finales como HVAC, refrigerador, agua caliente sanitaria y temperatura. La línea anterior muestra los cambios mensuales en el uso de energía en usos finales como HVAC, refrigerador, agua caliente sanitaria y temperatura exterior. El gráfico de líneas muestra el consumo diario promedio de todos los hogares en las regiones objetivo. El diagrama de dispersión al fondo describe el consumo diario promedio para un uso final durante los días de muestra codificados por colores por ubicación. El tamaño de los marcadores indica la desviación estándar del consumo de uso final. Leyenda: Arlington, VA (verde); Condado de Cook, Illinois (azul); Condado de Houston, TX (amarillo); Condado de Maricopa, AZ (marrón); Condado de King, WA (cian).

Variación del uso de energía de electrodomésticos sintéticos en ubicaciones objetivo a lo largo del año. Los gráficos de líneas muestran la variación en el consumo diario de energía para diferentes usos de energía de electrodomésticos a lo largo del año, promediado por mes. Las líneas representan el consumo diario promedio de todos los hogares en la región objetivo. El diagrama de dispersión al fondo describe el consumo diario promedio para un uso final durante los días de muestra codificados por colores por ubicación. El tamaño de los marcadores indica la desviación estándar del consumo de uso final. Hay similitudes notables en el uso de electrodomésticos en todos los lugares, lo que indica que las personas en diferentes partes del país usan electrodomésticos con un estilo similar. Esta es una observación razonable ya que las actividades cotidianas como cocinar y limpiar se realizarán en todos los hogares. Su patrón de uso puede cambiar durante el día, pero la energía total consumida por el aparato al final del día es similar. Arlington, VA (verde); Condado de Cook, Illinois (azul); Condado de Houston, TX (amarillo); Condado de Maricopa, AZ (marrón); Condado de King, WA (cian).

El consumo de electricidad para calentar agua es el más bajo durante los meses de verano en todos los lugares (Fig. 10c). En particular, las regiones de zonas climáticas cálidas-húmedas y cálidas-secas consumen la menor cantidad de energía. Esta observación surge de la relación entre \({E}^{{\rm{h2o,v}}}\) y \({T}_{m,z}^{{\rm{cold}}}\) descrito en la ecuación. 3. La temperatura de entrada del agua (\({T}_{m,z}^{{\rm{cold}}}\)) difiere en la escala temporal y espacial y depende de las temperaturas ambientales exteriores50 (Detalles en el Apéndice ). La Figura 13 muestra gráficos que describen la relación entre el tamaño del hogar y la cantidad de galones de agua caliente consumidos y la energía necesaria para calentar el agua. Tenga en cuenta que en este trabajo sólo consideramos calentadores de agua eléctricos.

La Figura 10a muestra que el consumo de HVAC varía significativamente a lo largo del año. El uso de HVAC es mayor en áreas cálidas y secas en verano en comparación con otras regiones, posiblemente debido a temperaturas más altas. Las características estructurales como el tamaño de la vivienda (pies cuadrados), la calidad del aislamiento, la antigüedad y la eficiencia de los equipos HVAC también afectan el consumo de HVAC de los hogares. Otra variable importante que impulsa el consumo de HVAC es el comportamiento del termostato interior, que está relacionado con el comportamiento/acciones de los ocupantes del hogar. En este trabajo, las temperaturas del termostato interior se fijan constantes durante todo el día. La calidad del aislamiento no se controla en los hogares (debido a la falta de datos). Suponemos que la vivienda está bien aislada y que los valores de aislamiento se implementan según las normas DOE para las respectivas zonas climáticas. En la Fig. 12a mostramos el efecto de los pies cuadrados (espacio acondicionado) de una vivienda sobre el uso de energía HVAC. En general, observamos que a medida que aumenta el espacio acondicionado de la vivienda, aumenta el consumo de climatización.

(a) Uso de HVAC sintético y área de la casa (es decir, área de piso). Diagrama de caja que compara el consumo diario de HVAC en un día de invierno para las ubicaciones objetivo seleccionadas por área de la casa (es decir, área de piso). El eje x agrupa el área de piso de las casas en cinco contenedores expresados ​​en dos unidades de pies cuadrados (ft2) y m2 (m2). Los contenedores son los siguientes: ≤1000 pies2, 1000 - 1500 pies2, 1500 - 2000 pies2, 2000 - 3000 pies2, ≥3000 pies2. Se observa que a medida que aumenta la superficie de la casa, el consumo de HVAC aumenta en todas las regiones. Las temperaturas invernales son relativamente moderadas en AZ y TX, por lo que el consumo de HVAC es menor en comparación con otras regiones. (b) Uso de iluminación sintética y tamaño del hogar. El consumo de iluminación aumenta a medida que aumenta el tamaño del hogar. El tamaño del hogar indica el número de miembros en un hogar.

Uso de agua caliente sintética y energía frente al tamaño del hogar sintético. El tamaño del hogar indica el número de miembros del hogar. Los gráficos de barras agrupadas muestran la cantidad de agua caliente consumida (en galones en (a)) y el uso de energía correspondiente en (b) según el tamaño del hogar en un día de invierno. La línea negra vertical en cada barra muestra la variación. El uso de agua y su variación aumenta con el tamaño del hogar. La cantidad de energía para el uso final de agua caliente aumenta con el tamaño del hogar y difiere según la región.

El uso de energía de iluminación varía según las estaciones en todas las regiones, ya que los niveles de irradiancia cambian con los fenómenos climáticos y las estaciones. La Figura 14b muestra series temporales de irradiancia promedio para las ubicaciones objetivo. El uso de iluminación correspondiente se muestra en la Fig. 14a. Como ejemplo, analizamos los perfiles de irradiancia mensuales durante 24 horas en Virginia para el año 2014 (Fig. 14d). La correspondiente serie temporal mensual de uso de energía de iluminación se muestra en la Fig. 14c. En la Fig. 12b se explora un ejemplo de consumo de iluminación en función del tamaño del hogar.

Mapa de calor que muestra la relación entre el uso de iluminación sintética por hora y la irradiancia por hora. (a) muestra perfiles de iluminación promedio anuales de 24 horas de ubicaciones objetivo representativas. (b) muestra el perfil de irradiancia anual promedio de 24 horas de ubicaciones objetivo representativas. (c) y (d) presentan la variación en el uso de iluminación y los perfiles de irradiancia correspondientes a nivel mensual para Arlington, VA. (c) presenta la variación del consumo de iluminación a lo largo del día en diferentes meses del año. (d) muestra la variación en el perfil de irradiancia mensual. Las unidades de medida para el uso de energía son kWh y la irradiancia es Watts/m2. El uso de energía de iluminación es inversamente proporcional a la irradiancia. El consumo de energía es mayor en las horas de la tarde y de la noche cuando el ocupante está activo en la vivienda. Los perfiles promedio de iluminación e irradiancia muestran diferencias regionales en la disponibilidad de irradiancia y el posterior uso de energía de iluminación. Los perfiles VA muestran que la luz diurna está disponible durante períodos más prolongados, lo que conduce a un menor consumo de energía de iluminación en comparación con el invierno.

La Figura 11 muestra el desglose del uso de electrodomésticos para diferentes electrodomésticos y dispositivos electrónicos. Ambas figuras muestran un gráfico de líneas que indica el consumo diario promedio del mes. El diagrama de dispersión al fondo describe el consumo diario promedio para un uso final durante los días de muestra codificados por colores por ubicación, donde el tamaño de los marcadores indica la desviación estándar del consumo de uso final. Se observa que el uso de electrodomésticos en actividades como cocinar, lavar platos, lavar la ropa, mirar televisión, usar la computadora y limpiar es bastante similar en diferentes regiones. El comentario anterior es intuitivamente cierto, ya que la duración del uso de los electrodomésticos y sus calificaciones pueden no variar entre regiones. Sin embargo, el momento de ocurrencia a lo largo del día puede variar de una casa a otra dependiendo de los horarios de los ocupantes, independientemente de a qué regiones geográficas pertenezcan.

Para analizar el conjunto de datos, los investigadores pueden utilizar cualquier lenguaje de programación como Python, Java, Matlab o R. Como se describe en la sección "Registros de datos", los archivos se almacenan en formato csv, por lo que la mayoría de las funciones de lectura de archivos en Los idiomas anteriores pueden admitir la lectura/acceso al conjunto de datos. A continuación, analizamos las posibles aplicaciones de los datos sintéticos publicados. También destacamos importantes desafíos y limitaciones de este trabajo.

Estamos publicando un conjunto de datos completo a nivel de hogares sobre el uso de energía. Además de los datos desglosados ​​sobre el uso de energía a nivel de los hogares, los datos del censo también incluyen la composición de los hogares. Este trabajo fue revisado por la Junta de Revisión Institucional (IRB) de la Universidad de Virginia y se determinó que estaba exento de la aprobación de la junta IRB, ya que este proyecto de investigación no involucraba investigación con sujetos humanos. El conjunto de datos se puede emplear de manera efectiva en diversas aplicaciones, como NILM (monitoreo de carga no intrusivo), análisis de perfiles de carga para observar similitudes/diferencias entre el consumo de uso final de diferentes regiones y estaciones, evaluar los efectos de las modernizaciones en edificios, estudiar los efectos del aumento de temperatura. en diferentes regiones, etc. Además, estos datos también se pueden utilizar para la calibración del modelo energético, la evaluación del comportamiento de los ocupantes, la implementación de estrategias de respuesta a la demanda y las intervenciones políticas. El conjunto de datos se puede aprovechar especialmente para entrenar modelos de aprendizaje profundo donde se aprecian cantidades masivas de datos. Estos modelos se pueden utilizar para pronosticar la demanda residencial en tiempo real. El conjunto de datos publicado es esencialmente series de tiempo junto con atributos categóricos y numéricos. Así, para analizarlos se puede utilizar cualquier herramienta estadística o lenguaje de programación. El estudio III del estudio de 'Validación técnica' ilustra ejemplos de los posibles usos del conjunto de datos.

El uso de datos sintéticos sobre la demanda de energía residencial tiene sus ventajas y desventajas. Los datos sintéticos horarios a escala nacional se pueden utilizar para realizar análisis de políticas nacionales e incluso potencialmente internacionales. La variabilidad espacio-temporal permite acceder a importantes cuestiones emergentes relacionadas con la equidad, la equidad y la accesibilidad energéticas a una escala fina. Se puede adoptar un enfoque a nivel de sistemas para abordar las preguntas desconcertantes esbozadas en los objetivos del Panel Intergubernamental sobre Cambio Climático (IPCC) para 2030. Por otra parte, los conjuntos de datos sintéticos también tienen sus limitaciones. Por ejemplo, la variabilidad a escala fina (nivel de minutos y variación semanal) del uso entre los hogares no puede captarse fácilmente en dichos conjuntos de datos sintéticos. Además, el comportamiento exhibido por cualquier familia sintética podría estar sesgado por los datos utilizados para la síntesis. Por lo tanto, cualquier conocimiento generado a partir de análisis de alta resolución debe considerarse cuidadosamente.

Un desafío importante en el desarrollo de perfiles de carga residencial sintéticos realistas a escala nacional y con una alta resolución espacio-temporal es encontrar conjuntos de datos apropiados para representar diferentes tipos de climas, demografía, electrodomésticos y patrones de actividad. La accesibilidad y disponibilidad de toda la información anterior de fuentes legítimas es crucial para mantener la confiabilidad de los modelos resultantes. Se desarrolla una infraestructura sólida y extensible para sintetizar diversas fuentes de datos en una estructura de información detallada en varias resoluciones espaciales (por ejemplo, combinando datos a nivel de hogares con datos relacionados con la zona climática, como los valores de aislamiento). La infraestructura consta de métodos para componer múltiples modelos y conjuntos de datos. El tiempo total para generar los datos sintéticos se redujo mediante el uso de capacidades informáticas de alto rendimiento.

Se discuten algunas de las limitaciones de nuestro trabajo. Los datos sintéticos actuales no incluyen el consumo de energía de los vehículos eléctricos ni la generación de energía mediante generación renovable (por ejemplo, paneles solares, viento). Los datos ATUS están disponibles para un día normativo para individuos. Así, las demandas relacionadas con la actividad y los electrodomésticos se generan para un día normativo con variaciones menores provenientes del modelo de actividad. Por lo tanto, es posible que nuestros datos sintéticos no puedan capturar adecuadamente la variación de la actividad diaria (por ejemplo, como se observa en la medición inteligente en tiempo real). Puede resultar complicado trabajar con esto, especialmente cuando se estudian escenarios de respuesta a la demanda. La envolvente de construcción considerada para un hogar sintético se simplifica debido a la falta de información necesaria para representar un grupo de población grande, lo que limita nuestra capacidad para emplear técnicas de modelado de construcción sofisticadas y de última generación. (por ejemplo, utilizamos un modelo simple basado en la física de HVAC para generar demanda de energía relacionada con calefacción y refrigeración).

El documento describe un enfoque ascendente para generar datos de gemelos digitales a gran escala de series temporales horarias desagregadas de uso de energía residencial para el sector residencial con resolución doméstica en los Estados Unidos contiguos para millones de hogares. El enfoque integra diversas encuestas y conjuntos de datos de código abierto, donde los modelos de uso final se desarrollan ampliando métodos bien establecidos o construyendo nuevos modelos. Se lleva a cabo una validación exhaustiva de los conjuntos de datos sintéticos utilizando datos reales/registrados sobre el uso de energía en resoluciones espaciales y temporales.

Se utilizan lenguajes de programación como Python 3 y Java 8 para modelar, analizar y desarrollar el marco. El código se deposita en el repositorio69 junto con el conjunto de datos.

Hart, DG Uso de AMI para realizar la Smart Grid. Asamblea general de 2008 de la IEEE Power and Energy Society: Conversión y suministro de energía eléctrica en el siglo XXI 1–2, https://doi.org/10.1109/PES.2008.4596961 (2008).

Mohassel, RR, Fung, AS, Mohammadi, F. & Raahemifar, K. Una encuesta sobre infraestructura de medición avanzada y su aplicación en Smart Grids. 2014 IEEE 27.a Conferencia Canadiense sobre Ingeniería Eléctrica e Informática (CCECE) 1–8, https://doi.org/10.1109/CCECE.2014.6901102 (2014).

Hailegiorgis, A., Crooks, A. & Cioffi-Revilla, C. Un modelo de hogares rurales basado en agentes y adaptación al cambio climático. Revista de Sociedades Artificiales y Simulación Social 21, 4, https://doi.org/10.18564/jasss.3812 (2018).

Artículo de Google Scholar

Auffhammer, M., Baylis, P. & Hausman, CH Se prevé que el cambio climático tendrá graves impactos en la frecuencia e intensidad de la demanda máxima de electricidad en los Estados Unidos. Actas de la Academia Nacional de Ciencias 114, 1886–1891, https://doi.org/10.1073/pnas.1613193114 (2017).

Artículo ADS CAS Google Scholar

Busby, JW y cols. Riesgos en cascada: comprensión del apagón invernal de 2021 en Texas. Investigación energética y ciencias sociales 77, 102106, https://doi.org/10.1016/j.erss.2021.102106 (2021).

Artículo de Google Scholar

Petri, Y. & Caldeira, K. Impactos del calentamiento global en los grados-día de calefacción y refrigeración residencial en los Estados Unidos. Informes científicos 5, 12427, https://doi.org/10.1038/srep12427 (2015).

Artículo ADS CAS Google Scholar

Goldstein, B., Gounaridis, D. & Newell, JP La huella de carbono del uso de energía en los hogares en los Estados Unidos. Actas de la Academia Nacional de Ciencias 117, 19122–19130, https://doi.org/10.1073/pnas.1922205117 (2020).

Artículo ADS CAS Google Scholar

Academias Nacionales de Ciencias, Ingeniería y Medicina. Acelerar la descarbonización del sistema energético de EE. UU. (The National Academies Press, Washington, DC, 2021).

Gillingham, KT, Huang, P., Buehler, C., Peccia, J. y Gentner, DR El clima y la salud se benefician de las mejoras intensivas en la eficiencia energética de los edificios. Avances científicos 7, eabg0947, https://doi.org/10.1126/sciadv.abg0947 (2021).

Artículo ADS CAS Google Scholar

Berrill, P., Gillingham, KT y Hertwich, EG Impulsores del cambio en el consumo de energía residencial y las emisiones de gases de efecto invernadero en EE. UU., 1990-2015. Cartas de investigación ambiental 16, 034045, https://doi.org/10.1088/1748-9326/abe325 (2021).

ADS del artículo Google Scholar

Berrill, P., Gillingham, KT y Hertwich, EG Vinculación de la política de vivienda, la tipología de vivienda y la demanda de energía residencial en los Estados Unidos. Ciencia y tecnología ambientales 55, 2224–2233, https://doi.org/10.1021/acs.est.0c05696 (2021).

Artículo ADS CAS Google Scholar

Kassakian, J. y col. El futuro de la red eléctrica: un estudio interdisciplinario del MIT. Instituto de Tecnología de Massachusetts, Iniciativa Energética del MIT (2011).

Deb, C., Dai, Z. & Schlueter, A. Un marco basado en aprendizaje automático para la modernización de edificios con un costo óptimo. Energía Aplicada 294, 116990, https://doi.org/10.1016/j.apenergy.2021.116990 (2021).

Artículo de Google Scholar

Nutkiewicz, A., Choi, B. & Jain, RK Explorando la influencia del contexto urbano en el rendimiento de la modernización energética de los edificios: una simulación híbrida y un enfoque basado en datos. Avances en Energía Aplicada 3, 100038, https://doi.org/10.1016/j.adapen.2021.100038 (2021).

Artículo de Google Scholar

Muratori, M. Impacto de la carga descoordinada de vehículos eléctricos enchufables en la demanda de energía residencial. Energía de la naturaleza 3, 193–201, https://doi.org/10.1038/s41560-017-0074-z (2018).

ADS del artículo Google Scholar

Mahdavi, A. et al. El papel de los ocupantes en la brecha de rendimiento energético de los edificios: ¿mito o realidad? Sostenibilidad 13, https://doi.org/10.3390/su13063146 (2021).

Tanaka, K., Wilson, C. & Managi, S. Impacto de las tarifas de alimentación en el consumo de electricidad. Estudios de políticas y economía ambiental https://doi.org/10.1007/s10018-021-00306-w (2021).

Tsaousoglou, G., Efthymiopoulos, N., Makris, P. & Varvarigos, E. Fijación de precios personalizada en tiempo real para una respuesta eficiente y justa a la demanda en cooperativas energéticas y mercados de flexibilidad altamente competitivos. Revista de sistemas de energía modernos y energía limpia 7, 151–162, https://doi.org/10.1007/s40565-018-0426-0 (2019).

Artículo de Google Scholar

Academias Nacionales de Ciencias, Ingeniería y Medicina. Fundamentos de la investigación analítica para la red eléctrica de próxima generación. (The National Academies Press. Washington, DC., 2016).

Kelly, J. & Knottenbelt, W. El conjunto de datos UK-DALE, la demanda de electricidad a nivel de electrodomésticos y la demanda general de cinco hogares del Reino Unido. Datos científicos 2, https://doi.org/10.1038/sdata.2015.7 (2015).

Kelly, J. & Knottenbelt, W. Metadatos para la desagregación de energía. Talleres de la 38ª Conferencia Internacional de Aplicaciones y Software Informáticos de IEEE 2014 https://doi.org/10.1109/compsacw.2014.97 (2014).

Webber, M. Puerto de datos de Pecan Street. Pecan Street Inc. https://www.pecanstreet.org/dataport/ (2013).

Nagasawa, K. y col. Gestión de datos para un proyecto de demostración de redes inteligentes a gran escala en Austin, Texas. ASME 2012 6ª Conferencia Internacional sobre Sostenibilidad Energética (2013).

Meyur, R. y col. Creación de redes de distribución de energía realistas utilizando infraestructura vial interdependiente. Conferencia internacional IEEE 2020 sobre Big Data (Big Data) 1226–1235, https://doi.org/10.1109/BigData50022.2020.9377959 (2020).

Li, H. Conjunto de datos sintéticos AlphaBuilding. Laboratorio Nacional Lawrence Berkeley (2021).

Klemenjak, C., Kovatsch, C., Herold, M. y Elmenreich, W. Un conjunto de datos de energía sintética para el monitoreo de carga no intrusivo en los hogares. Datos científicos 7, https://doi.org/10.1038/s41597-020-0434-6 (2020).

Thorve, S. y col. Simulación de la demanda energética residencial en zonas urbanas y rurales. Conferencia de simulación de invierno (2018).

Roth, J., Martin, A., Miller, C. & Jain, RK Syncity: Uso de datos abiertos para crear una ciudad sintética de estimaciones de energía de edificios por hora mediante la integración de métodos basados ​​en datos y basados ​​en la física. Energía Aplicada 280, 115981, https://doi.org/10.1016/j.apenergy.2020.115981 (2020).

Artículo de Google Scholar

Tong, K., Nagpure, A. & Ramaswami, A. Datos de uso de energía de todas las áreas urbanas en 640 distritos de la India para el año 2011. Datos científicos 8, https://doi.org/10.1038/s41597-021-00853- 7 (2021).

Bill, E., Shannon, G., Lee, R. y Sam, V. Poblaciones sintéticas y ecosistemas del mundo. Tecnología. Rep., Departamento de Estadística, Universidad Carnegie Mellon http://stat.cmu.edu/~spew/assets/spew_documentation.pdf (2017).

Gallagher, S., Richardson, LF, Ventura, SL y Eddy, WF SPEW: Poblaciones sintéticas y ecosistemas del mundo. Revista de estadística gráfica y computacional 27, 773–784, https://doi.org/10.1080/10618600.2018.1442342 (2018).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Beckman, RJ, Baggerly, KA y McKay, MD Creación de poblaciones de referencia sintéticas. Investigación sobre transporte Parte A: Política y práctica 30(6), 415–429, https://doi.org/10.1016/0965-8564(96)00004-3 (1996).

Artículo de Google Scholar

Administración de Información Energética de Estados Unidos. Datos de la encuesta RECS de 2015, https://www.eia.gov/consumption/residential/data/2015/. Consultado: noviembre de 2017 (2015).

Encuesta ATUS. Oficina de Estadísticas Laborales de EE. UU.: Encuesta sobre el uso del tiempo en Estados Unidos, https://www.bls.gov/tus/datafiles_2015.htm Consultado: marzo de 2018 (2015).

Lum, K., Chungbaek, Y., Eubank, S. y Marathe, M. Un enfoque de valores ajustados en dos etapas para el emparejamiento de actividades. Revista Internacional de Transporte 4, 41–56 (2016).

Artículo de Google Scholar

Torsten, H., Kurt, H. y Achim, Z. ctree: árboles de inferencia condicional. Paquete R versión 1.3-5 (2006).

Hothorn, T., Hornik, K. y Zeileis, A. Partición recursiva imparcial: un marco de inferencia condicional. Revista de estadística gráfica y computacional 15, 651–674, https://doi.org/10.1198/106186006X133933 (2006).

Artículo MathSciNet Google Scholar

Barrett, CL, Johnson, J. & Marathe, M. Entornos de información sintética de alto rendimiento: una arquitectura integradora en la era de la informática y los datos omnipresentes: Big Data (Simposio de ubicuidad). Ubicuidad 2018, 1:1–1:11, https://doi.org/10.1145/3158342 (2018).

Artículo de Google Scholar

EIA. Administración de información energética de EE. UU. (2020).

Swan, LG & Ugursal, VI Modelado del consumo de energía de uso final en el sector residencial: una revisión de las técnicas de modelado. Reseñas de energías renovables y sostenibles 13, 1819–1835, https://doi.org/10.1016/j.rser.2008.09.033 (2009).

Artículo de Google Scholar

Muratori, M., Roberts, MC, Sioshansi, R., Marano, V. y Rizzoni, G. Una técnica de modelado de alta resolución para simular la demanda de energía residencial. Energía aplicada 107, 465–473, https://doi.org/10.1016/j.apenergy.2013.02.057 (2013).

Artículo de Google Scholar

Shimoda, Y., Asahi, T., Taniguchi, A. y Mizuno, M. Evaluación del impacto a escala de ciudad de las medidas de conservación de energía residencial utilizando el modelo detallado de simulación de uso final. Energía 32, 1617–1633, https://doi.org/10.1016/j.energy.2007.01.007 (2007).

Artículo de Google Scholar

Kiichiro, T., Fuminori, S., Tsuyoshi, U., Osamu, S. y Takehiko, M. Modelo de simulación ascendente para estimar perfiles de demanda de energía de uso final en casas residenciales. Actas de los estudios de verano de ACEEE sobre eficiencia energética en edificios (2004).

Subbiah, R., Pal, A., Nordberg, EK, Marathe, A. & Marathe, Modelo de demanda de energía de MT para el sector residencial: un enfoque de primeros principios. Transacciones IEEE sobre energía sostenible 8, 1215–1224, https://doi.org/10.1109/TSTE.2017.2669990 (2017).

ADS del artículo Google Scholar

Chuck, B. y col. Estudio de temperatura interior residencial. Laboratorio Nacional de Energías Renovables. Informe Técnico NREL/TP-5500-68019 (2017).

Ulrike, J. & Klaus, V. Perfiles realistas de agua caliente sanitaria en diferentes escalas de tiempo. Universität Marburg 1–18 (2001).

de Santiago, J., Rodriguez-Villalón, O. & Sicre, B. La generación de perfiles de carga de agua caliente sanitaria en edificios residenciales suizos mediante predicciones estadísticas. Energía y edificios 141, 341–348, https://doi.org/10.1016/j.enbuild.2017.02.045 (2017).

Artículo de Google Scholar

Bob, H., Jay, B. y Greg, B. Herramienta para generar cronogramas realistas de eventos de agua caliente residencial. Conferencia SimBuild (2010).

Rouleau, J., Ramallo-González, AP, Gosselin, L., Blanchet, P. & Natarajan, S. Un modelo probabilístico unificado para predecir la ocupación, el uso de agua caliente sanitaria y el uso de electricidad en edificios residenciales. Energía y Edificios 202, 109375, https://doi.org/10.1016/j.enbuild.2019.109375 (2019).

Artículo de Google Scholar

Jeff, M., Xia, F. y Eric, W. Comparación de tecnologías avanzadas de calentamiento de agua residencial en los Estados Unidos. Informes Técnicos del Laboratorio Nacional de Energías Renovables (2013).

Wiehagen, J. & Sikora, J. Comparación de rendimiento de sistemas de agua caliente residencial. Informes del Laboratorio Nacional de Energías Renovables (2003).

Hendron, R. Definición de referencia de investigación de Building America, Informe técnico NREL/TP-550-44816. Informes del Laboratorio Nacional de Energías Renovables (2008).

Capasso, A., Grattieri, W., Lamedica, R. y Prudenzi, A. Un enfoque ascendente para el modelado de carga residencial. Transacciones IEEE sobre sistemas de energía 9, 957–964, https://doi.org/10.1109/59.317650 (1994).

ADS del artículo Google Scholar

Widén, J., Nilsson, AM y Wäckelgård, E. Un enfoque combinado de cadena de Markov y ascendente para modelar la demanda de iluminación doméstica. Energía y edificios 41, 1001–1012, https://doi.org/10.1016/j.enbuild.2009.05.002 (2009).

Artículo de Google Scholar

Palacios-García, E. et al. Modelo estocástico para el consumo eléctrico de iluminación en el sector residencial. Impacto de las acciones de ahorro energético. Energía y edificios 89, 245–259, https://doi.org/10.1016/j.enbuild.2014.12.028 (2015).

Artículo de Google Scholar

Stokes, M., Rylatt, M. & Lomas, K. Un modelo simple de demanda de iluminación doméstica. Energía y edificios 36, 103–116, https://doi.org/10.1016/j.enbuild.2003.10.007 (2004).

Artículo de Google Scholar

Richardson, I., Thomson, M., Infield, D. y Delahunty, A. Iluminación doméstica: un modelo de demanda de energía de alta resolución. Energía y edificios 41, 781–789, https://doi.org/10.1016/j.enbuild.2009.02.010 (2009).

Artículo de Google Scholar

Paatero, JV & Lund, PD Un modelo para generar perfiles de carga eléctrica doméstica. Revista Internacional de Investigación Energética 30, 273–290, https://doi.org/10.1002/er.1136 (2006).

Artículo de Google Scholar

Tribwell, LS y Lerman, DI Estudio básico del uso de energía en iluminación residencial. Consejo Americano para una Economía Energéticamente Eficiente (ACEEE) (1996).

Boardman, B. y col. DÉCADA - Equipos Domésticos y Emisiones de Dióxido de Carbono. Programa de Energía y Medio Ambiente Unidad de Cambio Ambiental Universidad de Oxford (1995).

Greenblatt, J., Hopkins, A., Letschert, V. & Blasnik, M. Uso de energía de refrigeradores y congeladores residenciales de EE. UU.: derivación de funciones basada en las características climáticas y del hogar. Departamento de Análisis Energético e Impactos Ambientales División de Tecnologías Energéticas Ambientales Laboratorio Nacional Lawrence Berkeley (2012).

Castro, NS, Bowman, J. & Twigg, B. El nuevo procedimiento de prueba de lavavajillas del Departamento de Energía de EE. UU.: desarrollo y primeros resultados. Instituto Nacional de Estándares y Tecnología (2005).

Christopher, I., Natascha Milesi, F. y Michael AG Uso de lavavajillas, lavadoras y secadoras por parte de los consumidores: necesidades y disponibilidad de datos. Nota técnica del NIST 1696, Laboratorio de ingeniería de la División de entorno de construcción del Grupo de control y sistemas mecánicos, Departamento de Energía (2011).

Nabinger, SJ Evaluación de los procedimientos de prueba de eficiencia de electrodomésticos de cocina. Instituto Nacional de Estándares y Tecnología, Departamento de Comercio de EE. UU. (1999).

Estrella de energía. Retrospectiva de producto: televisores. Informe ENERGY STAR (2021).

Estrella de energía. Requisitos del programa ENERGY STAR para computadoras. Informe ENERGY STAR (2010).

Palmstedt, P. Aspiradoras. Informe de alcance de la industria @AND@ del mercado ENERGY STAR (2011).

Palmstedt, P. Informe 2013 de la Encuesta global sobre aspiración de Electrolux. Electrolux (2013).

Thorve, S., Mortveit, H. & Marathe, M. Perfiles de uso de energía residencial sintético por hora desagregados a nivel de hogares para los Estados Unidos. Dataverse de la Universidad de Virginia https://doi.org/10.18130/V3/VJUZSH (2022).

Michael, BC, Theresa, GL, C., PC, Marye, H. y Kathi, R. Tecnologías domésticas de alto rendimiento: guía para determinar las regiones climáticas por condado. Laboratorio Nacional del Noroeste del Pacífico 7.3, 1–50, https://www.energy.gov/eere/buildings/downloads/building-america-best-practices-series-volume-73-guide-determining-climate (2015).

Datos de medición de la evaluación del parque de edificios residenciales (rbsa), alianza de eficiencia energética del noroeste. https://neea.org/data/residential-building-stock-assessment. Consultado: 2022-03-23.

Souza, V., Estrada, T., Bashir, A. y Mueen, A. Datos del medidor inteligente LADPU. Dríada https://doi.org/10.5061/dryad.m0cfxpp2c (2020).

Lin, J. Medidas de divergencia basadas en la entropía de Shannon. Transacciones IEEE sobre teoría de la información 37, 145–151, https://doi.org/10.1109/18.61115 (1991).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Kwac, J., Flora, J. & Rajagopal, R. Segmentación del consumo de energía del hogar utilizando datos horarios. Transacciones IEEE en Smart Grid 5, 420–430, https://doi.org/10.1109/TSG.2013.2278477 (2014).

Artículo de Google Scholar

Klemenjak, C., Kovatsch, C., Herold, M. y Elmenreich, W. SynD: un conjunto de datos de energía sintética para el monitoreo no intrusivo de cargas en los hogares. figshare https://doi.org/10.6084/m9.figshare.c.4716179 (2020).

Kolter, JZ & Johnson, MJ REDD: Un conjunto de datos públicos para la investigación de desagregación de energía. Taller SustKDD sobre Aplicaciones de Minería de Datos en Sostenibilidad (2011).

Kolter, JZ & Johnson, MJ REDD: El conjunto de datos de desagregación de energía de referencia. Lanzamiento inicial de REDD del MIT, versión 1.0 http://redd.csail.mit.edu/ (2011).

Makonin, S., Wang, ZJ y Tumpach, C. RAE: el conjunto de datos de energía de automatización de la selva tropical para el análisis de datos de medidores de redes inteligentes. CoRR abs/1705.05767, http://arxiv.org/abs/1705.05767 (2017).

Murray, D., Stankovic, L. y Stankovic, V. Un conjunto de datos de mediciones de carga eléctrica de hogares del Reino Unido a partir de un estudio longitudinal de dos años. Datos científicos 4, https://doi.org/10.1038/sdata.2016.122 (2017).

Murray, D., Stankovic, L. & Stankovic, V. REFIT: Mediciones de carga eléctrica (limpiadas). Universidad de Strathclyde https://doi.org/10.15129/9ab14b0e-19ac-4279-938f-27f643078cec (2015).

Rashid, H., Singh, P. & Singh, A. I-BLEND, un conjunto de datos de energía eléctrica de edificios comerciales y residenciales a escala de campus. Datos científicos 6, https://doi.org/10.1038/sdata.2019.15 (2019).

Rashid, H., Singh, P. & Singh, A. I-BLEND, un conjunto de datos de energía eléctrica de edificios comerciales y residenciales a escala de campus. figshare https://doi.org/10.6084/m9.figshare.c.3893581 (2019).

Paige, F., Agee, P. & Jazizadeh, F. flEECe, un conjunto de datos sobre el uso de energía y el comportamiento de los ocupantes para edificios residenciales para personas mayores asequibles con energía neta cero. Datos científicos 6, https://doi.org/10.1038/s41597-019-0275-3 (2019).

Paige, F. & Agee, P. flEECe, un conjunto de datos sobre el uso de energía y el comportamiento de los ocupantes para edificios residenciales para personas mayores con energía neta cero y asequibles. Marco de ciencia abierta https://doi.org/10.17605/OSF.IO/2AX9D (2019).

Shin, C. y col. El conjunto de datos ENERTALK, datos de consumo de electricidad de 15 Hz de 22 casas en Corea. Datos científicos 6, https://doi.org/10.1038/s41597-019-0212-5 (2019).

Shin, C. y col. El conjunto de datos ENERTALK, datos de consumo de electricidad de 15 Hz de 22 casas en Corea. figshare https://doi.org/10.6084/m9.figshare.c.4502780 (2019).

Kelly, J. y Knottenbelt, W. El conjunto de datos UK-DALE. Centro de datos energéticos de UKERC https://doi.org/10.5286/UKERC.EDC.000002 (2015).

Anderson, K., Ocneanu, A., Carlson, DR, Rowe, AG y Bergés, M. BLUED: un conjunto de datos públicos completamente etiquetados para la investigación de monitoreo de carga no intrusivo basado en eventos. Actas del segundo taller de KDD sobre aplicaciones de minería de datos en sostenibilidad (2012).

Anderson, K. Nombre del conjunto de datos: Conjunto de datos de desagregación de electricidad completamente etiquetado a nivel de edificio (AZULADO). github https://tokhub.github.io/dbecd/links/Blued.html (2011).

Barker, S. y col. Un conjunto de datos abiertos y herramientas para permitir la investigación en hogares sostenibles. Actas del primer taller de KDD sobre aplicaciones de minería de datos en sostenibilidad (SustKDD) (2012).

Barker, S. Conjunto de datos UMass Smart*: versión 2017. Repositorio UMassTrace https://traces.cs.umass.edu/index.php/smart/smart (2017).

Beckel, C., Kleiminger, W., Cicchetti, R., Staake, T. & Santini, S. El conjunto de datos ECO y el rendimiento de algoritmos de monitoreo de carga no intrusivos. Actas de la 1.ª Conferencia ACM sobre sistemas integrados para edificios energéticamente eficientes 80–89, https://doi.org/10.1145/2674061.2674064 (2014).

Pereira, L., Quintal, F., Gonçalves, R. & Nunes, N. SustData: un conjunto de datos públicos para la investigación de energía eléctrica ICT4S. TIC4S (2014).

Pereira, L. SustData: un conjunto de datos públicos para la investigación de energía eléctrica ICT4S. Marco de ciencia abierta https://osf.io/2ac8q/ (2021).

Pereira, L., Costa, D. & Ribeiro, M. Un conjunto de datos residenciales etiquetados para análisis de datos de medidores inteligentes. Datos científicos 9, 134, https://doi.org/10.1038/s41597-022-01252-2 (2022).

Artículo de Google Scholar

Monacchi, A., Egarter, D., Elmenreich, W., D'Alessandro, S. & Tonello, AM GREEND: Un conjunto de datos de consumo de energía de los hogares en Italia y Austria. Conferencia internacional IEEE de 2014 sobre comunicaciones de redes inteligentes (SmartGridComm) 511–516, https://doi.org/10.1109/SmartGridComm.2014.7007698 (2014).

Monacchi, A., Egarter, D., Elmenreich, W., D'Alessandro, S. & Tonello, AM GREEND: Un conjunto de datos de consumo de energía de los hogares en Italia y Austria. Laboratorios Lakeside de la Iniciativa Duke Energy https://energy.duke.edu/content/greend-electrical-energy-dataset (2021).

Pullinger, M. y col. El conjunto de datos de energía doméstica, electricidad, gas, datos de sensores contextuales y datos de encuestas de IDEAL para 255 hogares del Reino Unido. Datos científicos 8, 146, https://doi.org/10.1038/s41597-021-00921-y (2021).

Artículo de Google Scholar

Goddard, N. y col. El conjunto de datos de energía doméstica IDEAL. Edimburgo DataShare https://doi.org/10.7488/ds/2836 (2021).

Ruhnau, O., Hirth, L. & Praktiknjo, A. Series temporales de demanda de calor y eficiencia de bombas de calor para el modelado de sistemas energéticos. Datos científicos 6, https://doi.org/10.1038/s41597-019-0199-y (2019).

Ruhnau, O. Perfiles de calefacción When2Heat. Datos del sistema de energía abierto https://doi.org/10.25832/when2heat/2019-08-06 (2019).

Deming, WE y Stephan, FF Sobre un ajuste de mínimos cuadrados de una tabla de frecuencias muestreadas cuando se conocen las tablas marginales esperadas. Anales de Matemáticas. Estadísticas 11, 427–444 (1940).

Artículo MATEMÁTICAS Google Scholar

Fienberg, SE Un procedimiento iterativo para la estimación en tablas de contingencia. Los Anales de Estadística Matemática 41, 907–917 (1970).

Artículo MathSciNet MATEMÁTICAS Google Scholar

Muestra de Microdatos de Uso Público (PUMS). Documentación de PUMS, https://www.census.gov/programs-surveys/acs/microdata/documentation.2013.html. Consultado: noviembre de 2017 (2013).

Sistema de asimilación de datos terrestres. Datos climáticos del Sistema de asimilación de datos terrestres de América del Norte (NLDAS), https://ldas.gsfc.nasa.gov/nldas/. Consultado: marzo de 2018 (2016).

Laboratorio Nacional de Energías Renovables (NREL). Base de datos nacional de radiación solar (NSRDB), https://nsrdb.nrel.gov/data-sets/us-data. Consultado: noviembre de 2020 (2014).

Descargar referencias

Agradecemos a los revisores anónimos por sus útiles comentarios que nos ayudaron a mejorar el manuscrito. Agradecemos a los miembros de la Asociación Nacional de Cooperativas Eléctricas Rurales (NRECA) por proporcionar datos de validación para el condado de Rappahannock, Virginia y el condado de Horry, Carolina del Sur. Este trabajo cuenta con el apoyo parcial del premio número SIF160 del Fondo de Inversión Estratégica de la Universidad de Virginia, NSF EAGER CMMI-1745207, NSF Grant OAC-1916805 y NSF BIGDATA IIS-1633028.

Ciencia de sistemas de redes y computación avanzada, Instituto e Iniciativa de Biocomplejidad, Universidad de Virginia, Charlottesville, EE. UU.

Swapna Thorve, Young Yun Baek, Samarth Swarup, Henning Mortveit, Achla Marathe, Anil Vullikanti y Madhav Marathe

Departamento de Ciencias de la Computación, Universidad de Virginia, Charlottesville, EE. UU.

Swapna Thorve, Anil Vullikanti y Madhav Marathe

Departamento de Sistemas de Ingeniería y Medio Ambiente, Universidad de Virginia, Charlottesville, EE.UU.

Henning Mortveit

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

ST recopiló datos para los modelos, desarrolló e implementó el marco de modelado y todos los modelos individuales de uso de energía, preparó el manuscrito; YYB implementó el modelo ATUS, leyó y editó el artículo; HM y SS ayudaron con el desarrollo del modelo, la recopilación de datos, leyeron y editaron el manuscrito, brindaron orientación para escribir los antecedentes y el resumen; MM trabajó en el desarrollo de modelos, validación, preparación de manuscritos, brindó comentarios para la sección de Metodología y Validación; AM leyó y editó el manuscrito y ayudó con la validación; AV editó el manuscrito y ayudó con la validación. Todos los autores participaron en la redacción y revisión del manuscrito.

Correspondencia a Swapna Thorve o Madhav Marathe.

Los autores declaran no tener conflictos de intereses.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Thorve, S., Baek, YY, Swarup, S. et al. Perfiles sintéticos de uso de energía residencial de alta resolución para los Estados Unidos. Datos de ciencia 10, 76 (2023). https://doi.org/10.1038/s41597-022-01914-1

Descargar cita

Recibido: 26 de mayo de 2022

Aceptado: 15 de diciembre de 2022

Publicado: 06 de febrero de 2023

DOI: https://doi.org/10.1038/s41597-022-01914-1

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Fotónica de la naturaleza (2023)